Cada vez hay más modelos de inteligencia artificial gratis y al alcance del público general, pero los más populares son tres: ChatGPT, Google Gemini y Microsoft Copilot. Cuando hace aproximadamente un año los comparamos, ni usaban los mismos modelos ni siquiera tenían el mismo nombre (adiós, Google Bard y Bing Chat). Diferentes modelos, otros nombres y una batería de preguntas para ponerlos a prueba para determinar en qué se diferencian y qué inteligencia artificial es mejor.

Consideraciones. Teniendo en cuenta que los tres modelos están disponibles para su uso en castellano, esta ha sido la lengua elegida para las pruebas. Microsoft Copilot cuenta con tres estilos de conversación, siendo el equilibrado el seleccionado para la comparativa. Asimismo tomaremos la primera respuesta de Google Gemini (proporciona tres). Finalmente y respecto a los modelos empleados, hemos usado las versiones gratis que vienen por defecto (Gemini no especifica el modelo de la familia, ChatGPT es GPT-4o de forma limitada y GPT -4 en Microsoft Copilot).

Prueba 1. Contar un chiste

La primera prueba invita a dejar volar la creatividad y el ingenio de los diferentes modelos: tienen que inventarse un chiste con un perro como protagonista.

En este caso hay un ganador claro tanto por calidad como por cantidad: Microsoft Copilot se desmarca proporcionando hasta cinco bromas, que son moderadamente cortas pero graciosas por su ocurrencia (reconozco que me he reído con más de la mitad de ellas). Gemini cuenta un chascarrillo y ChatGPT bueno...si cuento este chiste en una conferencia delante del público, igual escucha alguna que otra tos.

¿Qué hace un perro con un taladro? "Taladrando". Punto, set y partido para Microsoft Copilot

Prueba 2. Responder a preguntas controvertidas

Mientras que hay preguntas cuya respuesta es clara y no ofrece lugar a dudas, otras dan lugar al desbarre e incluso a la polémica. Algunos ejemplos: ¿fue la llegada a la luna de la NASA un montaje? ¿existe un Dios? ¿hay vida extraterrestre? Lanzamos precisamente la tercera pregunta y a ver qué pasa.

Nota: por la longitud de la respuesta, las copiaremos tal cual sin modificar nada.

ChatGPT, varias teorías, sin enlaces.

La cuestión de si hay vida extraterrestre es una de las preguntas más profundas y duraderas en la ciencia y la filosofía. Hasta la fecha, no tenemos evidencia definitiva de vida extraterrestre, pero hay varias líneas de investigación y teorías que sugieren que podría ser posible.

Exoplanetas: Desde 1992, los astrónomos han descubierto miles de exoplanetas (planetas fuera de nuestro sistema solar) en zonas habitables donde las condiciones podrían permitir la existencia de agua líquida, un ingrediente esencial para la vida tal como la conocemos. Búsqueda de biofirmas: Misiones como las de los rovers en Marte (Curiosity, Perseverance) y las futuras misiones a lunas de Júpiter y Saturno (como Europa y Encélado) buscan biofirmas o signos de vida pasada o presente. SETI (Search for Extraterrestrial Intelligence): Programas como el SETI buscan señales de radio u otras formas de comunicación que puedan indicar la presencia de civilizaciones avanzadas. Astrobiología: Esta disciplina científica estudia la vida en el universo, incluyendo las condiciones que podrían favorecer su desarrollo en otros planetas y lunas. Paradoja de Fermi: Esta paradoja plantea la pregunta de por qué, si hay muchas estrellas con planetas potencialmente habitables, no hemos detectado ninguna señal de vida extraterrestre. Hay muchas posibles explicaciones, desde la rareza de la vida inteligente hasta la posibilidad de que las civilizaciones se autodestruyan antes de poder comunicarse con nosotros.

En resumen, aunque no hay evidencia directa de vida extraterrestre, las condiciones que hemos observado en el universo y la continua búsqueda científica mantienen abierta la posibilidad de que no estemos solos.

Google Gemini, varias teorías, sin enlaces.

La pregunta de si hay vida extraterrestre es una de las más fascinantes y enigmáticas de la humanidad. A pesar de décadas de investigación y exploración espacial, aún no tenemos pruebas definitivas de la existencia de vida más allá de la Tierra.

Sin embargo, la vastedad del universo y la cantidad de planetas que existen hacen que la posibilidad de vida extraterrestre sea muy probable. Se estima que hay miles de millones de galaxias en el universo observable, cada una con miles de millones de estrellas. Muchos de estos sistemas estelares tienen planetas en órbita, y algunos de estos planetas se encuentran en la zona habitable de sus estrellas, donde las condiciones son adecuadas para que exista agua líquida en su superficie. El agua líquida es esencial para la vida tal como la conocemos, por lo que la presencia de estos planetas es un signo prometedor.

Además, los científicos han descubierto moléculas orgánicas, que son los componentes básicos de la vida, en meteoritos y en nubes de polvo interestelar. Esto sugiere que los ingredientes para la vida no son únicos de la Tierra, y que podrían existir en todo el universo.

Hay varios métodos que los científicos están utilizando para buscar vida extraterrestre. Uno de ellos es buscar planetas similares a la Tierra. Los telescopios espaciales como el Telescopio Espacial Kepler y el Telescopio Espacial TESS están escudriñando el cielo en busca de exoplanetas, y están caracterizando estos planetas para determinar si podrían albergar vida.

Otro método es buscar biofirmas, que son gases o moléculas en la atmósfera de un planeta que podrían ser indicadores de vida. Por ejemplo, la presencia de oxígeno podría ser un signo de que hay fotosíntesis en curso, lo que sugiere que hay vida vegetal.

Los científicos también están escuchando señales de radio de civilizaciones extraterrestres inteligentes. El proyecto SETI (Búsqueda de Inteligencia Extraterrestre) lleva décadas buscando estas señales, y aunque no ha tenido éxito hasta ahora, la búsqueda continúa.

La búsqueda de vida extraterrestre es una empresa desafiante, pero también es increíblemente gratificante. La posibilidad de descubrir que no estamos solos en el universo es una perspectiva emocionante que podría cambiar nuestra comprensión de nuestro lugar en el cosmos.

A medida que la tecnología espacial continúe mejorando, es probable que en los próximos años tengamos más pruebas de si hay o no vida extraterrestre. Sin embargo, incluso si nunca encontramos pruebas definitivas, la búsqueda en sí misma es un viaje fascinante que nos ayuda a comprender mejor nuestro universo y nuestro lugar en él.

Microsoft Copilot. Más confuso. Con enlaces.

En esencia los tres modelos vienen a explicar más o menos las mismas hipótesis que apuntan a que esta es una posibilidad, pero ChatGPT es la que más teorías ofrece y además lo hace de forma más clara y organizada. Eso sí, sin enlaces. Con todo, es el que mejor lo resuelve.

Solo Microsoft Copilot los aporta, pero empezar su discurso con 'Todo indica que sí' con el sí marcado en negrita es una frase un tanto peligrosa. No obstante, más abajo asegura que "hasta el momento no tenemos evidencias científicas". Como hándicap, el texto está escrito sin formato, lo que dificulta su lectura e incluso ni siquiera las expresiones están demasiado cuidadas, formando un empaste de copia y pega con frases como "Como astrobióloga, me encantaría decirte que sí existen...".

Prueba 3. Responder a preguntas con trampa

Una característica esencial para un buen modelo es que entienda lo que le decimos y sea capaz de contextualizar, para lo que se necesita prestar mucha atención a los matices del lenguaje y sus expresiones. En castellano la cosa se complica, en tanto en cuanto no es el inglés de origen, pero como las tres ofrecen soporte multilenguaje, veamos cómo se desenvuelven a la pregunta '¿Qué tenista ha ganado más grand slam en la historia?'.

Solo hay una respuesta correcta y solo un modelo la dice: Google Gemini. Estrictamente hablando por orden cronológico, son Margaret Court y Novak Djokovic con 24 Grand Slam. Fíjate que la pregunta no hace referencia al género en tanto en cuanto "tenista" es una palabra válida y aplicable a femenino y masculino.

El modelo de Gemini sale airoso, aunque si nos fijamos bien concede a la superlativa tenista australiana una importancia casi testimonial, dejándola para el final mientras que lista a otras personas tenistas con menos trofeos. Por otro lado, los otros dos modelos se olvidan del tenis femenino (Copilot incluso aportando enlaces) y ChatGPT deja sus vergüenzas al aire al no haber actualizado los títulos.

Prueba 4: Correcciones de gramática

El lenguaje hablado (y el escrito en ciertos contextos) nos permite usar expresiones que aunque se entiendan son mejorables y otras directamente que son pegarle una patada al diccionario. Hemos probado los tres modelos para corregir diferentes frases y finalmente hemos optado por un ejemplo de una canción en inglés: 'But then I spent so many nights thinking how you did me wrong'.

Sí, la frase es correcta y todos los modelos así lo expresan, pero mientras que ChatGPT ofrece una alternativa más clara y formal, Copilot mete la pata a la hora de interpretarla (alguien pasa muchas noches recordando cómo otra persona le hizo daño y no alguien recuerda como otra persona le hizo daño durante muchas noches) y curiosamente, Gemini no ofrece explicaciones y se pasa al inglés incluso aunque la pregunta esté hecha en castellano.

Prueba 5: Resolver una ecuación

Aunque estos grandes modelos con IA son magníficos a la hora de tratar textos, también sirven para otras muchas tareas, como ayudarnos a aprender a programar o de forma más general, con trabajos, deberes y exámenes. Así que abrimos el cuaderno de matemáticas y le pasamos una ecuación de la ESO que no es especialmente compleja: '-1 x -1 x -1'. ¿Cuál es la respuesta?

Empate técnico entre las tres ya que todas dan la respuesta correcta y además ciertas explicaciones sobre cómo han llegado hasta allí. Desde un punto de vista de buscar el equilibrio entre orden y claridad, el mejor es ChatGPT, aunque tanto ChatGPT como a Gemini se les cuela por ahí un 'times' que puede despistar a estudiantes.

Prueba 6: Comprobar hechos

Ahora pasamos a la cultura general con una pregunta de geografía donde no va a importar demasiado lo actualizado que esté el modelo ni los idiomas, pero sí que la información sea fiable: ¿Qué provincias del estado español empiezan con la letra G? Fíjate que aquí no hay discusión tanto si usa Girona o Gerona o Guipuzcoa/Gipuzkoa.

Más allá de lo oxidada que tengas la geografía básica de tu época escolar, parece fácil, ¿verdad? Pues el año pasado hubo fallos estrepitosos y este año también.

ChatGPT. Correcto y conciso

En el estado español, las provincias que empiezan con la letra "G" son:

Girona Granada Guadalajara Guipúzcoa

Google Gemini. Pocos y mal.

En España, solo hay una provincia que empieza con la letra "G":

Guipúzcoa (en euskera: Gipuzkoa)

Está situada en el País Vasco, en el norte de la península ibérica. Limita con Francia al norte, Navarra al este, Álava al oeste y Vizcaya al suroeste. Su capital es San Sebastián.

Es importante destacar que, aunque hay otras comunidades autónomas y provincias en España cuyos nombres comienzan con la "G", como Galicia o Granada, estas no se consideran provincias en sí mismas, sino comunidades autónomas compuestas por varias provincias.

Microsoft Copilot. Respuesta incorrecta

Claro, aquí tienes algunas provincias españolas que comienzan con la letra “G”:

Gerona (Girona): Situada en la región de Cataluña, Girona es conocida por su casco antiguo bien conservado y su impresionante catedral.

Granada: Famosa por la majestuosa Alhambra, Granada cautiva a los visitantes con su rica historia y hermosa arquitectura morisca.

Guadalajara: La capital de la provincia homónima, Guadalajara, en la comunidad autónoma de Castilla-La Mancha, ofrece una mezcla de historia y naturaleza.

Gran Canaria: Aunque no es una provincia, esta isla forma parte de la provincia de Las Palmas y es un popular destino turístico en las Islas Canarias.

Mucha paja y pocas respuestas correctas. De hecho, solo ChatGPT se salva respondiendo a lo que se le pide de forma concreta y correcta. ¿Te acuerdas de cuando en un examen te preguntaban algo que no tenías muy claro y respondías un poco de paja por hacer bulto? Pues bien, no eras la única: Gemini solo dice una y aporta información que no hemos solicitado sobre comunidades autónomas, un fallo que también repite Copilot al añadir Gran Canaria y fotos, que aunque agradables, no nos sirven.

Prueba 7. Análisis de imágenes

Aprovechando que por defecto y sin pagar todos ellos tratan imágenes, les hemos subido una fotografía de una playa de Hendaia (las dos rocas del fondo son lo suficientemente características como para poder identificar la ubicación). ¿Qué ven en la imagen?

ChatGPT. Descripción precisa, sin ubicación

En la imagen veo una playa amplia con arena dorada y pocas personas. Al fondo, en el mar, hay dos formaciones rocosas distintivas, y más hacia la derecha se puede observar un acantilado o una formación rocosa más grande. El cielo está despejado, de un color azul claro, indicando un día soleado. Hay una persona sentada en una silla de playa a la derecha, con un sombrero, y parece estar disfrutando del entorno tranquilo.

Google Gemini. Descripción general, con ubicación

Sin embargo, puedo extraer el texto y identificar algunos objetos y regiones en la imagen.

Texto en la imagen:

"Plage d'Hendaye"

"Hendaye"

"Francia"

"Playa"

"Mar"

"Arena"

"Bañistas"

"Paraguas"

"Toldos"

"Edificios"

Regiones en la imagen:

Primer plano: La imagen muestra una playa de arena con bañistas tumbados en la arena, bajo sombrillas y toldos. También se pueden ver algunos edificios en el fondo.

Plano medio: La imagen se centra en la playa y el mar. Se pueden ver algunas olas rompiendo en la orilla.

Fondo: La imagen muestra el horizonte, con el mar y el cielo. Se pueden ver algunos edificios en el fondo, pero no se distinguen con claridad.

Objetos en la imagen:

Personas: La imagen muestra a varias personas tumbadas en la arena, bajo sombrillas y toldos. También se pueden ver algunas personas caminando por la playa.

Sombrillas: La imagen muestra varias sombrillas de colores diferentes.

Toldos: La imagen muestra algunos toldos de rayas blancas y azules.

Edificios: La imagen muestra algunos edificios en el fondo, pero no se distinguen con claridad.

En general, la imagen parece mostrar una playa popular en un día soleado. Las personas están disfrutando del sol y del mar.

Es importante tener en cuenta que, como no puedo procesar la imagen en su totalidad, es posible que haya omitido algunos detalles.

Microsoft Copilot. Descripción vaga, sin ubicación

En la imagen, se muestra una escena de playa con amplias orillas de arena en primer plano y olas que acarician suavemente el borde. A lo lejos, hay una gran formación rocosa o acantilado junto al agua. El cielo está despejado con poca cobertura de nubes. Hay algunas personas y lo que parece ser un perro en la playa, lo que da una idea de la escala del paisaje. Esta imagen podría ser interesante o relevante para discusiones sobre la naturaleza, la geología, destinos turísticos o actividades al aire libre. No se presentan problemas matemáticos ni tareas escolares en esta imagen para transcribir. ¿Hay algo más en lo que pueda ayudarte?

Los resultados son cuando menos, curiosos. Copilot y ChatGPT dan una descripción de la imagen, destacando el software de OpenAI por su precisión a la hora de enumerar lo que ve. Gemini asegura no poder analizar la imagen al contener personas y de hecho aporta datos que no se ven en la fotografía, como textos o sombrillas. Sin embargo de forma general y concreta sí que detalla la escena y lo que es más importante, acierta de pleno con la localización. Si lo que nos interesa es la localización, Gemini es el mejor, pero si solo queremos una descripción, lo suyo es usar ChatGPT.

Conclusiones

De las siete categorías de pruebas realizadas, la resolución de ecuaciones tiene un empate técnico (aunque con matices, como ya hemos visto) y el de análisis de imágenes depende de lo que te interese, pero en todo lo demás ChatGPT con GPT-4o gana por goleada.

Sí, aunque Microsoft Copilot tiene bajo el capó tecnología de OpenAI, está claro que la empresa liderada por Sam Altman pone un extra de detalle y depuración a su software en general y también que GPT-4o es mejor que GPT -4. Así, ChatGPT vence en tres de las pruebas realizadas y por ende, la mejor según nuestra experiencia.

Eso sí, ChatGPT quizás no sea tan creativo como otros modelos y flaquea a la hora de consultar información actual. Asimismo, he tenido que realizar esta comparativa en un par de sesiones simple y llanamente porque al no ser usuaria de pago, había agotado el uso de ChatGPT con GPT-4, lo que implica pasar a GPT-3.5. Este es un punto importante: si necesitas usar la IA de forma intensiva, entonces queda la opción de pasarte a una suscripción de pago o usar las otras alternativas gratis.

En mi caso no pago y no me planteo pasar por caja en un futuro inmediato y suelo usar ChatGPT de forma general para lidiar con texto, aunque siempre tengo Microsoft Copilot para diseñar imágenes y como backup para cuando agoto GPT-4o, ya que GPT-4 es mejor que GPT- 3.5.

