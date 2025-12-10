HOY SE HABLA DE

Europa ya tiene una IA de código abierto que se equipara a la élite china y supera a Estados Unidos: así es Devstral 2

Además de ser Open Source, su tamaño reducido facilita su implementación en hardware limitado, lo que reduce las barreras para desarrolladores, pequeñas empresas y aficionados

En 2023 OpenAI y ChatGPT encontraron su rival en Europa: la francesa Mistral AI lanzaba su nueva inteligencia artificial. Ahora esta empresa ha lanzado su nuevo modelo, que destaca por ser abierto al estilo de las reconocidas propuestas llegadas desde China como DeepSeek. El nuevo Devstral 2 se presenta como un "modelo de codificación de código abierto y agente CLI (interfaz de línea de comandos) de última generación". Comom explica la web oficial: 

Está disponible en dos tamaños: Devstral 2 (123B) y Devstral Small 2 (24B). Devstral 2 se distribuye bajo una licencia MIT modificada, mientras que Devstral Small 2 utiliza Apache 2.0. Ambos son de código abierto y cuentan con licencias permisivas para acelerar la inteligencia distribuida.


Como recuerda Xataka, la élite de los modelos abiertos para programación asistida ha sido de modelos llegados desde China (demás de DeepSeek está Kimi o Qwen). La llegada de Devstral 2 sitúa a Mistral "convierte a una compañía europea en aspirante real en un terreno que hasta ahora parecía reservado a otros". 

Devstral 2 supera a grandes tecnologías mundiales

En las cifras de SWE-Bench Verified publicadas por la compañía, Devstral 2 obtiene un 72,2%. Viendo el tráfico se puede ver que queda así solo un poco por debajo de DeepSeek V3.2 y supera a Kimi K2 Thinking, ambos modelos abiertos como la propuesta de Mistral. 

Por tanto su Devstral 2 queda en un gran segundo lugar. Desde Estados Unidos, las tecnologías más potentes son de software propietario (Gemini, GPT 5, Claude y Grok). Además, Grok, la IA de Elon Musk se muestra con una potencia inferior al de la tecnología europea

El Banco SWE verificado se centra en evaluar la capacidad de los sistemas de IA para gestionar tareas complejas y autónomas. "La evaluación de la IA en la ingeniería de software es especialmente desafiante debido a la naturaleza compleja de los problemas de codificación y la necesidad de evaluaciones precisas de las soluciones generadas", tal y como explica OpenAI.

Devstral Swe Bench Verified Openweights Vs Proprietary Models Dark 1

Como añade Xataka, SWE-Bench Verified es una prueba diseñada para evaluar si un modelo puede resolver tareas reales de programación. "La evaluación busca medir si el sistema entiende la estructura del proyecto, identifica la causa del problema y propone una solución coherente". 

"Tamaño reducido"

Devstral 2 (123B) y Devstral Small 2 (24B) son 5 y 28 veces más pequeños que DeepSeek V3.2, y 8 y 41 veces más pequeños que Kimi K2. Según la empresa, esto "demuestra que los modelos compactos pueden igualar o incluso superar el rendimiento de competidores mucho más grandes. Su tamaño reducido facilita su implementación en hardware limitado, lo que reduce las barreras para desarrolladores, pequeñas empresas y aficionados".

La misma empresa explica que Devstral 2 permite explorar bases de código y orquestar cambios en múltiples archivos, manteniendo al mismo tiempo el contexto a nivel de arquitectura. 

Rastrea las dependencias del framework, detecta fallos y reintenta con correcciones, lo que resuelve desafíos como la corrección de errores. "El modelo se puede ajustar para priorizar lenguajes específicos u optimizarlo para bases de código empresariales de gran tamaño". 

Mistral ha evaluado Devstral 2 frente a DeepSeek V3.2 y Claude Sonnet 4.5 mediante evaluaciones humanas realizadas por un proveedor de anotaciones independiente, con tareas estructuradas mediante Cline. 

"Devstral 2 muestra una clara ventaja sobre DeepSeek V3.2, con una tasa de éxito del 42,8 % frente a una tasa de fracaso del 28,6 %. Sin embargo, Claude Sonnet 4.5 sigue siendo significativamente preferido, lo que indica que persiste una brecha con los modelos de código cerrado".

