Martes, 1 de marzo de 2011 Creado por

Google Docs mejora su característica OCR (Optical Character Recognition) con la adición de 29 nuevos idiomas.

¿Pero qué es eso tan raro del OCR? Es una característica por la que podemos subir a Docs archivos en PDF o imágenes (JPG, BMP, PNG, GIF) que contengan texto y el sistema lo reconocerá y nos lo transformará a un documento de texto que podremos editar cómodamente.

El servicio es de lo más sencillo. Simplemente subimos el archivo en cuestión, seleccionamos el idioma en el que está escrito y el sistema lo convertirá a un archivo de texto. Lógicamente cuanta más calidad tenga el archivo de imagen mejor podrá reconocer el texto Docs…

Martes, 22 de junio de 2010 Creado por

La suite ofimática online de Google Docs acaba de añadir a su catálogo de servicios el reconocimiento OCR por el que podremos subir un documento PDF o imagen con texto escrito “a mano” y Docs lo transformará a texto plano.

Si alguno de vosotros tenéis escáner seguro que os suena este sistema (la mayoría suelen llevar algún software de este tipo) que permite (a veces con mayor o menor acierto) reconocer nuestra letra y generar un documento de texto plano a partir de ella, o escanear un libro y transcribirlo sin necesidad de escribirlo nosotros mismos.

La transcripción todavía dista de ser perfecta (sobre todo si en el documento a convertir aparecen imágenes), pero menos da una piedra… Además el servicio está recién estrenado, con lo que todavía tiene mucho camino por recorrer.

Vía | Google OS

Miércoles, 30 de septiembre de 2009 Creado por

ocr

Gracias a Google Codec Samples podremos subir un archivo (JPEG, GIF o PNG) con un máximo de 10 MB y automáticamente Google mediante su tecnología OCR (Optical Character Recognition – Reconocimiento óptico de caracteres) creará el correspondiente archivo de texto en nuestra cuenta Google Docs.

De esta forma nos podremos beneficiar de un OCR en la nube bastante práctico y rápido. De momento el servicio está en una web aparte que requiere de autorización para acceder a Google Docs, pero es de esperar que el servicio se integre en Google Docs.

Domingo, 5 de abril de 2009 Creado por

freeocrnet

Softi FreeOCR es la combinación ideal, junto con nuestro scanner, para pasar cualquier texto en papel a formato digital.
Sumamente práctico si, como mucha gente, tienes multitud de documentos en papel y tu velocidad de mecanografiado no es demasiado rápida o simplemente no te apetece gastar tu tiempo en hacerlo de esta forma.
La aplicación reconoce el ingles por defecto aunque es posible que reconozca el texto en español descargando desde este enlace Spanish language data for Tesseract los archivos necesarios para que reconozca el idioma español.

Una vez descargados lo que debes hacer es pasar todo el contenido de la carpeta “tessdata” a tu carpeta local “tessdata” situada dentro de tu carpeta de Windows (normalmente c:\windows), asi de simple.
Si por lo que fuera te pierdes en el proceso no te preocupes, tan sólo tienes que seguir estos pasos:
Dentro de la aplicación vas a la opción de menu: “Settings->open lenguaje folder” y se te abrirá la carpeta de “tessdata” (la que tienes dentro de tu carpeta local de windows), ahí es donde tienes que pasar todos los archivos contenidos en la carpeta “tessdata” que te has bajado, después inicia o reinicia en el caso de que tengas abierto el programa y ya podrás digitalizar sin problemas tus textos en español.

Enlace:  http://www.softi.co.uk/freeocr.htm