El truco definitivo para copiar y pegar texto de un PDF a MS Word sin destrozar el texto

Word
1 comentario Facebook Twitter Flipboard E-mail

En el trabajo diario de oficina es habitual recurrir al corta&pega para pasar información de unos documentos a otros. Sin embargo, las diferencias de formatos entre documentos puede convertir en una pesadilla algo tan sencillo como recurrir al Ctrl+C/Ctrl+V

Es decir, ¿alguna vez habéis probado a copiar texto de un PDF (cuando es posible y no se trata de un mero escaneo, que no es tan infrecuente) y pegarlo en un procesador de textos? Habrás comprobado que se inserta un salto de línea al final de cada línea original, ¿verdad?

No es mucho problema cuando hablamos de un párrafo breve, pero ¿y si necesitamos copiar y pegar el contenido de varias páginas? Una pesadilla, como decía: la forma en que se pega el texto nos obliga a la tediosa tarea ir línea por línea arreglándolo para que esté legible y presentable. En cualquier caso, siempre puedes recurrir a convertir de PDF a Word

Las versiones más modernas de Word incluyen la función de exportar de PDF a DOCX, pero si usas una versión más antigua o una alternativa open source, este truco te será más útil

Es cierto que hay herramientas y servicios online (como RemoveLinebreaks) que pueden ayudarnos a solventar este problema, pero se agradecería poder hacerlo directamente desde Word (o cualquier otro software similar que uses para trabajar rutinariamente con textos).

La cuestión es que sí existe un truco que lo permite, y una investigadora universitaria de Historia llamada Alice Hicklin ha cosechado un gran éxito en Twitter desvelándolo:

"Si pasa mucho tiempo copiando texto de archivos PDF a Word como yo, espero que este consejo pueda ser útil. Si el PDF termina dividido en muchas líneas, no es necesario que lo arregle manualmente. Simplemente vaya a Buscar y Reemplazar, escriba ^p en buscar y un espacio en reemplazar".
Puedes abrir el diálogo de 'Buscar y Reemplazar' usando el atajo de teclado Control + L en MS Word

Ojo, si por defecto usas la separación automática entre párrafos, puedes encontrarte con que el texto que acabas de pegar en Word con este truco, al copiarlo posteriormente en otra aplicación, sencillamente termine fusionado en un único y enorme párrafo. Para evitar esto, la opción más recomendable es volver a hacer uso del cuadro de Buscar y Reemplazar, poniendo '^p' en el campo de búsqueda y '^p^p' en el campo de 'Reemplazar todo'. Esto creará un espacio manual que sobrevivirá al proceso de cortar y pegar.

Un vistazo a…
Comic Sans, la tipografía más popular (y odiada)

Diferencia entre 'salto de línea' y 'marca de párrafo'

Técnicamente, '^p' es lo que conocemos como "marca de párrafo", mientras que para buscar y reemplazar saltos de línea propiamente dichos deberíamos utilizar la combinación '^l' en el campo de 'Reemplazar'. El primero es el resultado de pulsar 'Enter', y el segundo de pulsar 'Mayúsc + Enter'.

Esto es posible gracias a que Microsoft Word —al igual que otros procesadores de texto— nos permite buscar no sólo texto, sino también caracteres especiales no imprimibles (aunque sí visualizables si así lo deseamos: en' Archivo > Opciones > Presentación' podemos activar la visualización de las marcas de párrafo, que se mostrarán con este símbolo: ¶).

¿Y si sigo teniendo problemas con el formato de texto aun usando la exportación desde Word?

Si dispones de alguna de las versiones más actualizadas de Word, es posible que, sencillamente, quieras ignorar todo lo anterior y recurrir a la opción (a priori más rápida) de abrir un PDF con Word y guardarlo en formato *.docx. Pero algunos PDFs siguen dando problemas aun de este modo, por lo que podemos recurrir a los que más saben de convertir PDFs: Adobe. Advertimos, sin embargo, que este truco no puede repetirse muchas veces, y es para casos muy puntuales.

Así, deberás abrir el PDF con la versión gratuita de Adobe Acrobat que posiblemente tengas ya instalada en tu PC. En la barra lateral, verás que una de las primeras opciones es la de 'Export PDF', dándote la opción por defecto de convertirlo a formato DOCX. Si pulsas en el botón de 'Convertir', se te desplegará una página en la que se te recuerda que esta opción es, en realidad, de pago, y te mostrará las posibles opciones de suscripción...

Screenshot 193

...pero la primera de dichas opciones también cuenta con una opción de prueba gratuita de una semana. Recuerda, claro está, cancelar el pago antes de que transcurra ese plazo, y ya está: tienes 7 días para trabajar con tus PDFs rebeldes. Si la seleccionas (tendrás que dar tus datos de pago) y reinicias Adobe Acrobat, se instalarán las funciones premium y podrás usar finalmente la función de conversión.

Como puedes ver debajo, el PDF convertido de esta manera (izquierda) conserva mejor el formato (tipografías, alineación...) del texto que el convertido desde Word (derecha):

Screenshot 194

Una versión anterior de este artículo fue publicada en 2022.

Comentarios cerrados
Inicio