feed

ocr

Google Docs introduce reconocimiento OCR para reconocer texto en PDFs y en imágenes

4 comentarios

google docs ocr pdf reconocimiento texto

Google acaba de añadir una opción interesante en su suite ofimática online: la posibilidad de poder subir una imagen o un archivo PDF al servicio y que éste pueda reconocer los caracteres utilizando el sistema de reconocimiento OCR y convertirlos en un documento editable.

El reconocimiento de caracteres OCR es un sistema que seguro que os suena si tenéis un escáner: detecta caracteres a partir de una imagen y los convierte a texto plano, de modo que podemos por ejemplo escanear un libro y transcribirlo automáticamente sin tener que copiarlo nosotros a mano. Google sencillamente ha trasladado este sistema de reconocimiento en Google Docs.

De todos modos los resultados, tras probar la conversión de un PDF a un documento editable, no es que sean ideales. La conversión omite todas las imágenes, y si quieres transcribir un PDF con ilustraciones pasarás a tener un texto plano (que no siempre es correcto) sin retornos de línea ni las ilustraciones. Menos da una piedra, pero esperemos que Google poco a poco vaya mejorando esta funcionalidad.

Vía | Google OS

Anunciate aquí
Anunciate aquí

OCR Terminal, tu lector de OCR online

2 comentarios

OCR Terminal, tu lector de OCR onlineSupongo que la mayoría de vosotros conocerá alguna aplicación de escritorio de OCR. En la mayoría de los casos suelen ser aplicaciones muy pesadas y además de pago. Para la mayoría de nosotros no es necesario tener una suite demasiado compleja porque normalmente el uso que hacemos del OCR es puntual.

Por ello mismo nace OCR Terminal, una web a la que podremos subir archivos de JPG, PDF y TIFF y nos devolverá un archivo de texto editable con cualquier procesador de textos. Para ello simplemente nos tendremos que registrar gratuitamente la web.

Leer más

Anunciate aquí

Google indexa documentos escaneados

2 comentarios

El objetivo de Google es clasificar el máximo de información posible de la disponible en la red. Para ello, implementan en su buscador soporte para cada vez más tipos de ficheros. Ya hace mucho tiempo que permiten las búsquedas dentro de PDF, siempre que estos contuvieran texto.

El problema estaba en documentos PDF con imágenes, algo que han solucionado mediante el uso de un OCR para convertir imágenes en texto. De este modo, también son capaces de buscar dentro de documentos escaneados que, de otro modo, no podían ser indexados.

Leer más

Anunciate aquí

WSL Weblogs SL