"Es la IA más inteligente del mundo": Elon Musk anuncia Grok 4 prometiendo que tiene más nivel que cualquier doctorado

Grok 4 se sitúa como la IA más potente del mercado, según los análisis independientes

Grok Musk
Facebook Twitter Flipboard E-mail
jose-alberto-lizana

José Alberto Lizana

Editor

La noche de este miércoles, la compañía de inteligencia artificial dirigida por Elon Musk, xAI, presentó su último modelo de IA: Grok 4. El anuncio se hizo en directo y estuvo lleno de promesas y afirmaciones ambiciosas sobre la gran evolución que promete esta inteligencia artificial, integrada actualmente en X (antes Twitter) y utilizada, en muchos casos, como herramienta de verificación de noticias… aunque con no pocos errores.

Grok es la respuesta de xAI —y de Musk— al auge de modelos como los de OpenAI y Google, capaces de analizar imágenes, responder preguntas complejas y mantener conversaciones contextuales. Sin embargo, esta nueva versión llega en un contexto complicado: Grok recientemente ha protagonizado titulares por emitir mensajes antisemitas o incluso por una “crisis de identidad” en la que se creía que era Elon Musk.

Un Grok con grandes promesas (y dudas)

Las expectativas generadas por xAI son muy altas. Este nuevo modelo busca competir directamente con el esperado GPT-5 de OpenAI, previsto para ser lanzado a finales de este verano. Elon Musk no dudó en lanzar afirmaciones que lo mangnificaba:

Con respecto a las preguntas académicas, Grok 4 es mejor que el nivel de doctorado en todas las materias, sin excepciones. [...] Es la IA más inteligente del mundo [...] A veces, puede que le falte sentido común y que aún no haya inventado nuevas tecnologías ni descubierto nueva física, pero eso es sólo cuestión de tiempo
Test Grok

Al igual que sus competidores, xAI también ha lanzado dos versiones de su IA: Grok 4 y Grok 4 Heavy. Esta última es una variante "multiagente" diseñada para lograr un rendimiento superior. Según explicó Musk, este modelo genera varios agentes que trabajan en paralelo sobre un mismo problema y luego comparan sus resultados para seleccionar la mejor solución.

Y si hablamos de los benchmarks según los datos proporcionados por xAI, Grok 4 ha obtenido un 25,4% en el benchmark Humanity's Last Exam (una prueba con miles de preguntas de ciencias, humanidades y matemáticas). Este resultado supera los 21,6% de Gemini 2.5 Pro de Google y el 21% del modelo o-3 de OpenAI.

No obstante, como ocurre habitualmente, estas cifras deben tomarse con cautela hasta que sean validadas por pruebas independientes. Algo que ya han hecho desde Artificial Analysis, que ha considerado que Grok 4 pasa a ser el modelo de IA número uno (siempre teniendo en cuenta que es el de la API). En los test GPQA Diamond consiguió una puntuación máxima de 88%, y sus resultados en el Humanity's Last Exam también confirman lo dicho por xAI. De esta manera, todas las expectativas generadas por Musk sobre su gran rendimiento parecen confirmarse de manera independiente.

Analisis
Grok 4 Test

Sobre el papel, Grok 4 promete ofrecer respuestas más profundas, elaboradas y fiables. Pero todavía está por ver cómo se comporta en el uso cotidiano, fuera de la API.

El plan de suscripción más caro hasta la fecha.

Junto con el lanzamiento de Grok 4, xAI ha estrenado un nuevo plan de suscripción llamado SuperGrok Heavy, con un precio de 300 dólares al mes. Esta suscripción da acceso anticipado a Grok 4 Heavy y otras funcionalidades exclusivas, en una estrategia que recuerda a los planes premium de OpenAI, Google o Anthropic.

Además, xAI ha confirmado que Grok 4 estará disponible vía API para que los desarrolladores puedan integrarlo en sus propias aplicaciones. Pero además, se va a poder usar a través de 'Super Grok'.

En Genbeta | Por qué llamarle ingeniería del prompt cuando ingeniería del contexto es mejor para conseguir los mejores resultados con la IA

Inicio