El pasado uno de abril nos hacíamos eco de la caída de GPT-4 del ranking oficioso de la industria de los chatbots. Por primera vez, un modelo de IA no desarrollado por OpenAI se alzaba con la corona: Claude 3, de Anthropic, había sorprendido en los días previos, tanto por sus capacidades inesperadas como por proporcionar respuestas que los usuarios consideraban más útiles y coherentes que las de sus rivales.

Y, aunque todo apuntaba a que OpenAI terminaría recuperando el liderato, no imaginábamos que sería tan rápido: tras lanzarse esta semana la última generación de GPT-4 (GPT-4 Turbo), ésta ha vuelto a alzarse con el primer puesto del Chatbot Arena. No ha hecho falta, en realidad, ni esperar al lanzamiento de GPT-5, que muchos rumores de la industria sitúan en este mismo verano.

Pero, ¿qué ofrece este nuevo GPT-4 que explique este ascenso en los rankings?

Las novedades de GPT-4 Turbo

Con el lanzamiento de la última iteración de GPT-4, OpenAI no sólo logra seguir a la vanguardia de la inteligencia artificial generativa, sino que también redefine lo que los usuarios pueden esperar de los chatbots. GPT-4 Turbo, ya disponible para los usuarios de pago de ChatGPT (en sus modalidades Plus, Team y Enterprise), no sólo mejora funciones existentes, sino que también introduce otras nuevas.

Así GPT-4 Turbo viene equipado con mejoras en el lenguaje, haciendo que ChatGPT adopte un tono más conversacional y humano mientras genera respuestas más concisas y directas que versiones anteriores. A eso se le suman mejores capacidades matemáticas, de razonamiento lógico y de codificación.

OpenAI también ha extendido:

El horizonte temporal de los datos de entrenamiento del modelo: ahora GPT-4 'sabe cosas' ocurridas hasta el 9 de abril (por primera vez, la diferencia entre este límite y su lanzamiento es de pocas horas), lo que mejora notablemente su capacidad para abordar temas actuales y responder con información relevante y actualizada.

ahora GPT-4 'sabe cosas' ocurridas hasta el 9 de abril (por primera vez, la diferencia entre este límite y su lanzamiento es de pocas horas), lo que mejora notablemente su capacidad para abordar temas actuales y responder con información relevante y actualizada. Su ventana de contexto: al ampliarse hasta 128k, ahora nos permite analizar "más de 300 páginas de texto en un solo mensaje".

No menos importante que eso es que el modelo también ha introducido el soporte para solicitudes visuales en formato JSON (algo fundamental a la hora de integrar aplicaciones de terceros con GPT) y la capacidad de lectura directa del contenido de las imágenes... lo que le permitiría, por ejemplo, ofrecer sugerencias de recetas partiendo de fotos de ingredientes disponibles.

