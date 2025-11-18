Google ha presentado Gemini 3, su nuevo modelo de inteligencia artificial. La compañía lo califica como su sistema de razonamiento más avanzado hasta la fecha (¿alguien esperaba lo contrario?). Desde Mountain View mencionan que ha sido diseñado específicamente para capturar la profundidad y los matices en las interacciones.

Lo más relevante para el usuario es que Gemini 3 estará disponible de serie en el renovado buscador de Google a través del Modo IA. Es la primera vez que Google integra las capacidades de su modelo de IA de vanguardia directamente en el motor de búsqueda desde el día uno.

Esta nueva versión también está disponible hoy mismo en la aplicación de Gemini, así como para desarrolladores a través de AI Studio, Vertex AI y su nueva plataforma de desarrollo de agentes, Google Antigravity. El modelo Gemini 3 Pro se lanza en versión preliminar (preview). Incluye soporte para 30 nuevos idiomas, entre los que se encuentran el catalán, el euskera y el gallego.

Razonamiento de "nivel doctorado" y récord en pruebas

Según los datos aportados por Google, Gemini 3 Pro supera "significativamente" a su predecesor, 2.5 Pro, en todas las principales pruebas comparativas de IA.

Encabeza la clasificación de LMArena con 1.501 puntos, superando en 50 ELO al anterior modelo que ostentaba el récord, Gemini 2.5 Pro. Eso sí, aquí conviene recordar el fiasco de Llama 4 en la arena, cuando Meta utilizó un modelo que luego no fue el que puso en la mano de los usuarios.

Google presumen de un razonamiento de "nivel de doctorado" al obtener puntuaciones del 37,5% en Humanity's Last Exam (sin herramientas) y del 91,9% en GPQA Diamond.

Establece un nuevo estándar en matemáticas con un 23,4% en MathArena Apex, donde sus rivales no superan el 1,6% (Claude Sonnet 4.5)

En la comprensión multimodal (texto, imágenes, vídeos), ha logrado puntuaciones del 81% en MMMU-Pro y del 87,6% en Video-MMMU.

Otra novedad es que el modelo será más directo: Google asegura que prefiere ofrecer información valiosa en lugar de recurrir a clichés, diciendo "lo que necesitas oír, no solo lo que quieres oír". Esto probablemente sea algo que podamos notar pronto (como la falta de "humanidad" de GPT-5 frente a 4o) en su lanzamiento), pero la duda es qué otras cosas notaremos. El gran reto: que Gemini 3 Pro no se note más "tonto" con el tiempo.

Para problemas más complejos, Gemini 3 ofrece el modo Deep Think (Pensamiento Profundo). Con este modo, de nuevo según sus pruebas, Google ha mejorado aún más los resultados, alcanzando un 41,0% en Humanity's Last Exam y un 45,1% en ARC-AGI 2 (con ejecución de código). El acceso a Deep Think estará disponible para suscriptores de Google AI Ultra en las próximas semanas.

Aplicaciones multimodales y ventana de contexto

Una de las grandes novedades es la capacidad de sintetizar información de forma fluida en distintas modalidades (texto, imágenes, vídeo, audio y código). Esto se logra gracias a su ventana de contexto de 1 millón de tokens.

Esto permite al usuario, por ejemplo, descifrar y traducir recetas escritas a mano en distintos idiomas para crear un libro de cocina familiar. También puede analizar vídeos de deportes, como un partido de pickleball, para identificar áreas de mejora y generar un plan de entrenamiento.

Otra aplicación es analizar papers académicos complejos y generar código para crear guías interactivas y visualizaciones que ayuden a comprender el material.

Agentes de programación y la plataforma Antigravity

Gemini 3 es el mejor modelo de codificación colaborativa y autónoma que Google ha creado. Encabeza la clasificación de WebDev Arena con una impresionante puntuación de 1.487 ELO.

Para aprovecharlo, Google lanza Google Antigravity. Esta es una nueva plataforma de desarrollo basada en agentes. Los agentes de Antigravity tienen acceso directo al editor, al terminal y al navegador.

Según la compañía, estos agentes pueden planificar y ejecutar de forma autónoma tareas de software complejas e integrales. Para demostrarlo dan la cifra lograda en el benchmark Vending-Bench 2, que pone a prueba la planificación a largo plazo en un negocio simulado. En este test, Gemini 3 Pro logra 5.478 dólares, frente a 573 de Gemini 2.5 Pro o 3.838 de Claude Sonnet.

