Universidades descubren que ChatGPT desconoce muchas palabras españolas y que, en general, no entiende muy bien el idioma

  • Gracias a una aplicación de código abierto, tres universidades españolas pueden ver el conocimiento que ChatGPT tiene de los idiomas

  • Hay que tener esto en cuenta para evitar ir perdiendo léxico si se usan muchos las inteligencias artificiales para crear textos

Jon Tyson 8mmtym 3xmy Unsplash
5 comentarios Facebook Twitter Flipboard E-mail

ChatGPT aterrizó en el mercado hace un año revolucionando el mundo de la inteligencia artificial ya que trajo una herramienta muy potente a manos de todo el mundo. Es una IA generativa que nos puede ayudar a reducir el tiempo que gastamos en ciertas tareas laborales y hasta se cree que puede eliminar muchos puestos de trabajo.

Ahora, la Universidad Politécnica de Madrid junto con investigadoras de otros grandes centros educativos, han hecho una investigación para poner a prueba el software de OpenAI.

Han partido de la base, según sus palabras, de que "tenemos un conocimiento muy limitado de estas  herramientas", como que ignoramos algo tan básico como cuántas palabras de idiomas como el español puede identificar ChatGPT,

Te adelantamos que esta herramienta entrenada con muchos datos de internet, millones de repositorios públicos, incluyendo código del propio GitHub, según las informaciones públicas al respecto, puede ser que conozca muy bien el idioma inglés (su sede principal está en Estados Unidos), pero está limitada en cuanto al español.

Un vistazo a…
ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

90.000 palabras del diccionario de la RAE

Investigadores de la Universidad Politécnica de Madrid (UPM), junto a colegas de la Universidad Carlos III de Madrid (UC3M) y la Universidad de Valladolid (UVa), se propusieron descubrir el conocimiento que ChatGPT tiene del castellano.

El primer paso fue crear una aplicación nueva de nombre ChatWords. Su objetivo:  evaluar el conocimiento léxico que el software más famoso de OpenAI tiene de diferentes idiomas. Probaron las más de 90.000 palabras del diccionario de la RAE.

El modelo ChatGPT3.5 turbo desconoce aproximadamente el 20%. Y  no solo eso. Del 80% restante, ofrece significados erróneos en algunos  casos, en torno al 5%.

Javier Conde, profesor ayudante en la Escuela Técnica Superior de Ingenieros de Telecomunicación (ETSIT) de la UPM dice que analizando  los significados que da ChatGPT de las palabras, vemos que hay un  porcentaje no despreciable en que el sentido que señala es incorrecto y que "quizás ChatGPT no sea hoy en día tan sabio como aparenta".

Esta es una de las conclusiones principales aunque cabe decir que, según estudios, un hispanohablante reconoce 30.000 palabras de media.

Un escenario con cada vez menos vocabulario

Pedro Reviriego, profesor titular de la ETSIT , ve una preocupación respecto a esto: considera que resulta “muy factible un escenario en que el contenido recién generado tenga un número cada vez  menor de palabras distintas” y esto hay que tenerlo en cuenta para "garantizar la  riqueza léxica en el texto creado por inteligencia artificial".

La aplicación ChatWords es de código abierto. El objetivo ahora es usarla para evaluar otros idiomas y para comprender mejor  el conocimiento léxico que tienen las herramientas de inteligencia  artificia.

Según el estudio oficial, este trabajo se enmarca en el proyecto Redes del Futuro para  Centros de Procesados de Datos y Operadores, financiado por la Agencia  Estatal de Investigación, y cuenta con el apoyo de OpenAI, laboratorio  estadounidense responsable de ChatGPT.

Vía | Wired

Imagen| Foto de Jon Tyson en Unsplash

Inicio