Este programador buscó acrónimos obscenos ocultos en los títulos de 32 millones de artículos académicos (y encontró varios casos)

Este programador buscó acrónimos obscenos ocultos en los títulos de 32 millones de artículos académicos (y encontró varios casos)
2 comentarios Facebook Twitter Flipboard E-mail

@Fesshole es el nombre de una cuenta de Twitter (con más de medio millón de seguidores) que te propone "confesar tus pecados anónimamente" y esperar a que Internet te absuelva. Hace dos días, entre las 'confesiones' tuiteadas incluyó esta:

"Cuando publico trabajos serios de investigación académica, intento que las letras iniciales del título deletreen algo obsceno".

Este hecho atrajo la atención de Rob Manuel. Ese nombre probablemente no te suene de nada, pero en el Reino Unido es conocido por ser el cofundador del popular sitio web B3ta, que lleva 21 años en activo y se describe como una "comunidad de artes digitales pueriles". A Manuel también le gusta programar bots de Twitter, como @swearclock, que se dedica a tuitear la hora mientras insulta.

"¿Y para qué decías que querías aprender a programar en Python, hijo mío?"

Así que quizá nadie se extrañe si Manuel contestó a la confesión de Fesshole con un tuit en el que afirmaba estar descargando un archivo de 130 GB de títulos de trabajos académicos y disponerse a escribir "algún código capaz de detectar aquellos que forman acrónimos groseros".

"Probablemente encontraré algunos accidentales, imagino. Ya veremos: la descarga del archivo tarda una eternidad, probablemente más de lo que tardaré en escribir el código".

Si los científicos ya llamaron 'SHIT' (Super Huge Interferometric Telescope) a un telescopio, no podemos asombrarnos de nada

Al día siguiente, otro tuit difundía los avances logrados en su proyecto: el código (en Python) ya estaba listo y, a partir de un listado de 32 millones de títulos de 'papers' —extraído de Unpaywall—, había elaborado (y colgado en GitHub) un segundo listado filtrando aquellos cuyos acrónimos coincidieran con las palabras malsonantes más usadas en lengua inglesa.

Este segundo listado (con unos 80.000 resultados) señalaba las coincidencias diferenciándolas entre 'exactas' (el acrónimo coincide con un insulto), 'cercanas' (una única letra extra antes o después), 'dobles' (referencias a dos insultos dentro de un acrónimo más amplio), 'comienzo' (las primeras letras de un acrónimo más amplio coinciden con un insulto) y 'quizás' (opciones más improbables). Y con base a eso, ahora Manuel recurría a la colaboración ciudadana:

"Lo que me gustaría que hicierais es leer los resultados y elegir cualquiera que crea que vale la pena resaltar".

Y, efectivamente, entre las respuestas aportadas por varios usuarios, han detectado coincidencias que, en su opinión, parecen ir más allá de la mera casualidad:

  • "Sexual Hormones in the Pathophysiology of Tourette's Syndrome" - 'Shitpot' es una forma vulgar para decir 'taza de váter', pero también es un modo de decir de alguien que es 'un mierda'… un término muy adecuado para estudiar el Síndrome de Tourette, que puede provocar el uso incontrolado de palabras obscenas.

  • "Colo-Recto-Anal Physiology" - 'Crap'. 'Mierda', literalmente. Ajustado al tema de la investigación, sin duda.

  • "Pressurized Irrigation System Selection" - 'Piss'. Supongo que cuenta como 'sistema de irrigación', sí.

  • "Cloture Reform and Party Government in the Senate"'Crap Gits', o 'gilipollas de mierda'… vaya, parece que algún investigador tenía una idea muy definida acerca de los senadores responsables de una ley sobre cercados…

Peddo
A ver, que es cierto que estas cosas a veces ocurren sin querer…

Vía | Rob Manuel Fuck Yeah!

Comentarios cerrados
Inicio