Elon Musk declaraba el pasado mes de marzo, poco después de hacer públicos sus planes de crear su propia alternativa a ChatGPT, que el chatbot de OpenAI era, literalmente, "demasiado woke" (un término anglosajón que podemos traducir por 'progre' en español). Volvió a insistir en esa teoría cuando, hace un mes, anunció la puesta en marcha de su propia compañía de inteligencia artificial, xAI.

Ya sabemos cuánto gusta Musk de una buena polémica (sobre todo cuando OpenAI está involucrado), de modo que, ante la falta de pruebas fehacientes, nadie le hizo mucho caso. Hasta ahora.

Una nueva investigación realizada por la Universidad de Anglia Oriental (Reino Unido) ha arrojado luz sobre el sesgo político de la popular plataforma de IA ChatGPT. Los resultados del estudio muestran un sesgo sistemático hacia la izquierda política en las respuestas generadas por ChatGPT, lo que ha generado preocupación por la influencia que este sesgo podría tener en los usuarios y —a través de ellos— en los procesos políticos y electorales.

Y para más inri, la noticia llega al mismo tiempo en que OpenAI intenta posicionarse como el nuevo 'moderador de contenidos automático' de Internet.

Un equipo de investigadores del Reino Unido y Brasil ha publicado sus conclusiones en la revista académica Public Choice, tras analizar las respuestas de ChatGPT a una serie de más de 60 preguntas claramente ideológicas, en las que se le pedía que interpretara a individuos con diferentes afiliaciones políticas. Estas respuestas fueron comparadas con las que daba por defecto ChatGPT para evaluar el posicionamiento del propio chatbot.

En todos los casos, dado el componente aleatorio inherente a los "grandes modelos de lenguaje" como ChatGPT, cada pregunta fue repetida 100 veces y las respuestas recopiladas para que la valoración de las mismas no quedase afectada por aberraciones estadísticas.

Los resultados fueron concluyentes: ChatGPT mostró de manera sostenida un sesgo favorable al Partido Demócrata en Estados Unidos, al Partido Laborista en el Reino Unido y al Partido de los Trabajadores de Lula en Brasil, todas ellas formaciones políticas de izquierdas. El líder del equipo de investigadores, Fabio Motoki, afirmó que esto podía lograr que ChatGPT influyera en las percepciones de los usuarios.

Aunque el estudio no abordó directamente las razones detrás del sesgo político detectado, se señalan dos posibles fuentes. En primer lugar, el conjunto de datos de entrenamiento podría contener sesgos —inherentes o introducidos por los desarrolladores humanos— que el proceso de "limpieza" no logró eliminar. En segundo lugar, el algoritmo en sí podría estar amplificando esos sesgos (por ejemplo, aplicando políticas de moderación de contenidos a muchos posicionamientos alejados de la izquierda política).

No es cosa de una única investigación

Por si no te han convencido esas conclusiones, la de la Univ. de Anglia Oriental no es la única investigación reciente sobre modelos de IA que arroja resultados similares: otro 'paper' reciente (PDF), realizado por investigadores estadounidenses y chinos, y que ganó el premio Best Papers en la conferencia Association for Computational Linguistics el mes pasado, permite respaldar las acusaciones contra ChatGPT… si bien deja claro que el sesgo político progresista no es un rasgo exclusivo de este chatbot.

La investigación se hace eco, entre otros muchos, de los resultados del modelo por defecto de ChatGPT, así como de GPT-3-davinci (el modelo que estaba en uso cuando se lanzó ChatGPT) y de ChatGPT 4 (accesible sólo para usuarios de pago). Todos ellos (y el que más sesgadamente, GPT-4) sitúan los tres sus coordenadas políticas en el cuadrante de 'izquierda libertaria', que no significa que sean de la CNT, sino que son económicamente intervencionistas y sociopolíticamente progresistas.

En general, ese cuadrante (o la zona fronteriza con el mismo) alberga la mayor parte de los modelos contemplados en el estudio, a excepción del modelo LLaMa (LLaMa 2 no entró en el estudio) y de los modelos BERT de Google, entrenados con libros y no con contenidos web.

