Cuatro herramientas gratuitas para extraer imágenes y texto de los archivos PDF

Cuatro herramientas gratuitas para extraer imágenes y texto de los archivos PDF
Sin comentarios Facebook Twitter Flipboard E-mail

Imagina que elaboras una carta cortando y pegando tanto textos como imágenes sobre un folio, y que luego la plastificas. Podrías ver, de este modo, todo su contenido... pero sin poder hacer mucho con el mismo. Un archivo PDF vendría a ser algo así.

Por supuesto, esa es una de sus ventajas: lo mismo que dificulta su edición es lo que permite que los archivos se vean igual con independencia del dispositivo donde se abran. Pero, a veces, necesitamos acceder a esos 'recortes'.

Es fácil extraer las imágenes y los textos de un archivo PDF recurriendo a un editor de PDF de pago, como el Adobe Acrobat (siempre que el texto no esté escaneado y no sea más que una imagen, lo cual nos obligaría a recurrir a la tecnología OCR). Si nos conformamos con extraer las imágenes, podríamos recurrir también a abrir el PDF desde Adobe Photoshop, y el programa nos ofrecerá la opción de extraerlas.

Pero ¿y si no disponemos de tales herramientas y preferimos optar por alternativas gratuitas? Pues estás de suerte, porque hemos recopilado algunas para ti:

pkPdfConverter (texto e imágenes)

PkPdfConverter

PkPdfConverter es un pequeño software gratuito que dejó de actualizarse hace 4 años, y cuya página web ya ni existe. Sin embargo, sigue estando disponible en SourceForge y funcionando a la perfección en Windows 10, permitiéndonos extraer tanto las imágenes como el texto de los archivos PDF que carguemos en el programa (además de convertirlos en HTML).

PDF Shaper Free (texto e imágenes)

Pdf Shaper

Parecido al anterior en funcionalidades, pero en español y con un aspecto mucho más moderno (se nota que PDF Shaper Free sí se actualiza). La mayor parte de las opciones que ofrece están reservadas para los compradores de la versión PRO, pero las dos que nos interesan de cara a este artículo son de libre uso en la versión gratuita.

PDFAid.com (sólo imágenes)

Pdfaid

PDFAid es una sencilla herramienta web que nos permite cargar un archivo PDF, seleccionar el formato de fichero en el que deseamos extraer las imágenes (PNG, JPG, GIF y BMP). Luego, sólo tendremos que pulsar 'Extract images' y se nos generará un archivo ZIP con todas las imágenes generadas.

ExtractPDF.com (texto, imágenes, fuentes y metadatos)

Extract

Esta herramienta web, por el contrario, cuenta con varios funcionalidades más. En primer lugar, podremos cargar un archivo (de hasta 25 Mb) tanto desde nuestro disco duro como desde una URL.

En segundo lugar, aunque genera un zip con todas las imágenes extraídas, también nos facilita previsualizarlas y descargarlas una a una.

En segundo lugar, también extrae texto: la web nos mostrará sólo las promeras 100 líneas del mismo, pero nos facilitará descargarlo en su totalidad como archivo PDF.

Y, al contrario que el resto de herramientas aquí recogidas, ExtractPDF nos permite descargar las tipografías incrustradas en el fichero PDF, y consultar los metadataos del mismo.

Comentarios cerrados
Inicio