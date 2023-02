La semana pasada, Google realizó un evento de presentación de Bard, la nueva IA rival de ChatGPT con la que pretende complementar a su buscador en un futuro cercano. Ante la falta de verdaderas novedades (no se dijo nada que no se hubiera revelado ya a la prensa en comunicados anteriroes), uno de los hechos más comentados de dicho evento fue un fallo de Bard a la hora de responder una pregunta:

En su respuesta Bard, afirma que el JWST fue usado para sacar las primeras imágenes de un planeta fuera del Sistema Solar... cuando lo cierto es que esa imagen la tomó el Very Large Telescope (VLT) del European Southern Observatory en 2004. Acto seguido, Google perdió 100.000 millones de dólares por la caída de sus acciones.

Ya sabemos que está en la naturaleza de los 'modelos grandes de lenguaje' como ChatGPT y Bard 'mentir' en sus respuestas como consecuencia de lo que llamamos 'alucinaciones', así que la gran pregunta sería por qué este error tuvo tal impacto mediático y económico, y nadie reparó en los diversos errores de Bing/ChatGPT que pudieron verse en el evento de Microsoft un día antes.

Dmitri Brereton afirmaba sorprendido en Twitter que "las personas que están entusiasmadas con Bing AI deben haber visto una demo diferente a la que vi yo... cometió varios errores durante la demostración, mucho peores que el error de Bard de Google". Veamos un resumen de todo aquello en lo que la IA de Bing se equivocó...

Se inventó por completo la información sobre la aspiradora manual 'Bissell Pet Hair Eraser': la fuente que citaba no incluye nada sobre "potencia de succión limitada", "longitud corta del cable" o sobre el "ruido que puede asustar a algunas mascotas", todos ellos datos que el usuario, desde luego, valoraría muy negativamente a la hora de elegir un modelo de esta clase. Sobre todo la parte del cable corto (no tiene cable).

De nuevo, Bing se inventó por completo varios datos sobre la vida nocturna de Ciudad de México, atribuyendo a Cecconi's Bar un inexistente sitio web donde el usuario teóricamente puede hacer reservas y ver su menú, así como

Primer Nivel Night Club es, según Bing, "popular entre la gente joven", pese a que sólo existen dos reseñas de hace varios años (una en TripAdvisor y otra en Facebook) y no se lo menciona en TikTok. Por otro lado, afirma que 'El Almacén' y 'El Marra' son locales "sin calificaciones ni reseñas", cuando éstas se cuentan por cientos en Google y otras plataformas.

Pero lo peor con mucha diferencia de aquella (mediáticamente) exitosa demostración de hace unos días fue el estropicio de la IA de Bing al ofrecer una de sus funcionalidades más esperadas: las funciones de IA integradas en el navegador Microsoft Edge que permiten a éste interactuar con la web que estamos visualizando.

En el ejemplo usado por Microsoft, el asistente integrado en Edge (que, recordemos, usa la misma tecnología basada en ChatGPT que Bing) tenía que resumir las conclusiones de un sencillo documento financiero de 15 páginas en PDF.

Problema: la mayoría de las cifras del resumen son falsas. Según Bing, "Gap Inc. reported operating margin of 5,9%..." , pese a que directamente "5,9%" no aparece en ningún lugar de ese documento.

Pero después de eso se nos aportan datos como "un margen bruto de 37,4%, ajustado por cargos por deterioro" o el descenso del "margen comercial en 370 puntos básicos". ¿Problema? La cifra de margen bruto corresponde al no ajustado (si se ajusta, sería del 38,7%), y el descenso del margen comercial fue mucho mayor, de 480 puntos.

Peor aún: "Gap Inc. reafirmó su guía para todo el año fiscal 2022, esperando un crecimiento de las ventas netas de dos dígitos". No, lo cierto es que lo que esperan es un descenso de las ventas. Y así todo.

Uno de los usuarios que contestaba en Twitter a la publicación de Brereton se hacía la misma pregunta que tú mismo te estarás haciendo ahora mismo:

Terrifyingly hilarious overview of an insane number of mistakes in last week’s Bing/ChatGPT demo. Why did Google lose 10% of their value for a technicality, but Microsoft threw up 50 minutes of bullshit and no one noticed?https://t.co/4J1oQ2cwc4