Kimi K2 protagoniza otro 'momento DeepSeek': este modelo razonador libre 'made in China' empata en casi todo con GPT-5

El panorama global de la IA parece estar viviendo un nuevo punto de inflexión (aunque, por otro lado, llevamos un tiempo teniendo muchos de esos): la empresa china Moonshot AI, respaldada por Alibaba, ha presentado Kimi K2 Thinking, un modelo de IA de razonamiento profundo que ha logrado situarse —inesperadamente— por encima de los sistemas más avanzados del mundo, incluidos GPT-5 de OpenAI y Claude Sonnet 4.5 de Anthropic.

Con esta versión, Moonshot no solo desafía el dominio de las grandes tecnológicas estadounidenses (repitiendo la gesta de DeepSeek R1 de hace 10 meses), sino que marca un hito histórico para la IA de código abierto, demostrando que la frontera del pensamiento automatizado puede alcanzarse fuera del ecosistema de Silicon Valley.

Comparándolo con GPT-5 y Gemini 2.5 Pro

Kimi K2 Thinking no es otro chatbot más: la novedad reside en que se trata de un modelo razonador, diseñado para pensar, planificar, usar herramientas y resolver problemas de forma autónoma.

En términos de funcionalidad, Kimi K2 Thinking rivaliza con ChatGPT-5 y Gemini 2.5 Pro en casi todos los aspectos. Es multilingüe, multimodal (puede procesar texto, imágenes y código), y ofrece razonamiento explicativo visible, lo que facilita seguir su 'línea de pensamiento' durante una conversación.

Las principales diferencias radican en su filosofía abierta y su precio. Mientras GPT-5 y Gemini son ecosistemas cerrados y caros de mantener —con costes de entrenamiento que superan los 500 millones de dólares—, K2 Thinking es un modelo open source desarrollado con una inversión estimada de apenas 4,6 millones.

A nivel de usuario, los tres modelos ofrecen experiencias conversacionales casi idénticas, aunque es cierto que Kimi aún no incluye generación de imágenes.

En Genbeta

DeepSeek R1 fue una revolución para la IA y, desde entonces, sus creadores no han hablado. Ahora un investigador confiesa sus temores

Un modelo que 'piensa' paso a paso

Según la propia documentación técnica de Moonshot, el sistema puede ejecutar hasta 300 llamadas secuenciales a herramientas sin intervención humana, conservando la coherencia de razonamiento a lo largo de cada paso.

Este tipo de funcionamiento lo coloca dentro de la nueva generación de 'agentes de IA', sistemas capaces de realizar tareas complejas sin instrucciones detalladas por parte del usuario.

K2 Thinking logra sostener ventanas de contexto de hasta 256.000 tokens, ideales para procesar textos o proyectos de gran longitud

En la práctica, esto significa que K2 Thinking puede desde programar software completo hasta planificar un viaje o analizar grandes volúmenes de documentos, combinando búsqueda web, razonamiento lógico y ejecución de código.

El corazón de K2 Thinking se basa en una arquitectura Mixture-of-Experts (MoE) (basada en el uso combinado de varios LLM especializados) con un billón de parámetros, de los cuales 32.000 millones se activan por inferencia. Gracias a esta estructura modular, el modelo elige dinámicamente qué 'expertos' activar según la tarea, reduciendo el consumo de cómputo sin sacrificar precisión.

Resultados que superan a los gigantes

Los resultados de Kimi K2 Thinking en pruebas estandarizadas son contundentes. Según los datos publicados por Moonshot, el modelo alcanzó:

44,9 % en Humanity’s Last Exam (HLE), que mide razonamiento experto multidisciplinar.
60,2 % en BrowseComp, una prueba de navegación y búsqueda autónoma en la web.
71,3 % en SWE-Bench Verified y 83,1 % en LiveCodeBench v6, evaluaciones de programación.
56,3 % en Seal-0, orientada a la recuperación de información en contextos reales.

Estos números sitúan a K2 Thinking por encima de GPT-5 y Claude Sonnet 4.5 en varios de los principales benchmarks de razonamiento, búsqueda y uso de herramientas. Incluso en tareas matemáticas avanzadas como AIME 2025 o HMMT 2025, logra una paridad casi total con el modelo de OpenAI.

En Genbeta

DeepSeek en local era justo lo que buscaba: una inteligencia artificial de calidad, privada y sin suscripciones

Código abierto con una licencia singular

Uno de los aspectos más revolucionarios de K2 Thinking es su condición de modelo completamente abierto. Su código y pesos están libremente disponibles en Hugging Face, bajo una licencia MIT modificada que permite su uso comercial, con una sola condición: si un producto basado en K2 supera los 100 millones de usuarios mensuales o 20 millones de dólares de ingresos al mes, deberá mostrar la atribución "Kimi K2" en su interfaz.

Este enfoque híbrido equilibra la libertad de uso con un reconocimiento ético y estratégico, y convierte a Kimi K2 Thinking en el modelo de código abierto más permisivo y avanzado del mundo.

Más allá del laboratorio: un modelo usable y accesible

Lejos de ser un mero experimento académico, Kimi K2 Thinking ya está disponible al público en kimi.com mediante una interfaz muy similar a ChatGPT. Los usuarios pueden registrarse gratis y conversar con las versiones básicas (Kimi 1.5 o K2 Chat), mientras que el acceso al modo completo 'Thinking' se ofrece por suscripción mensual desde 19 dólares.

Además, los desarrolladores cuentan con una API abierta que permite integrar el modelo en aplicaciones externas. Sus precios, muy inferiores a los de GPT-5, se sitúan en torno a 0,6 USD por millón de tokens de entrada y 2,5 USD por millón de salida, lo que lo hace competitivo para empresas que buscan soluciones personalizadas sin depender de infraestructuras propietarias.

Imagen | Marcos Merino mediante IA

En Genbeta | Tras evaporar miles de millones de sus acciones, el CEO de Nvidia dice que DeepSeek fue “una cosa fantástica”. Estos son sus motivos

Kimi K2 protagoniza otro 'momento DeepSeek': este modelo razonador libre 'made in China' empata en casi todo con GPT-5

Mientras empresas estadounidenses como OpenAI, Google y Anthropic concentran recursos billonarios en infraestructuras y chips, China avanza con modelos abiertos, eficientes y sorprendentemente baratos

Comparándolo con GPT-5 y Gemini 2.5 Pro

Un modelo que 'piensa' paso a paso

Resultados que superan a los gigantes

Código abierto con una licencia singular

Más allá del laboratorio: un modelo usable y accesible

Explora en nuestros medios

Comparándolo con GPT-5 y Gemini 2.5 Pro

Un modelo que 'piensa' paso a paso

Resultados que superan a los gigantes

Código abierto con una licencia singular

Más allá del laboratorio: un modelo usable y accesible

RECIBE "Xatakaletter", NUESTRA NEWSLETTER SEMANAL

Explora en nuestros medios