Google indexará documentos escaneados

El motor de búsqueda de Google ha comenzado a indexar documentos escaneados gracias a el uso de una herramienta llamada Reconocimiento Óptico de Caracteres (sus siglas en inglés vienen a ser OCR) que permite convertir las fotografías a texto para poder indexarlas posteriormente.

Sin esta herramienta estos documentos serían inaccesibles, ya que no habría manera de ser interpretada de forma automática por un ordenador, por lo que no se podría haber ofrecido en los resultados. Día a día me sorprendo más de las cosas que se pueden hacer gracias a un ordenador, nunca se va a terminar.

Sin dudas esta herramienta requerirá una potencia de proceso inimaginable, no puedo pensar como en menos de un segundo los motores de búsqueda hacen sus peticiones no sólo en la web, sino en documentos PDF, documentos escaneados, presentaciones flash, etc. Si deseas ver un ejemplo de este tipo de búsquedas, puedes hacerlo aquí.

Enlace: Google Blog
Vía: Genbeta

Compartir en Google Plus

Acerca de Lisandro Berardi

  • WordPress Comentarios
  • Facebook Comentarios