El CEO de OpenAI por fin se pronuncia sobre DeepSeek: “Lanzaremos modelos mucho mejores”

Tras la oleada de novedades de DeepSeek, OpenAI hace control de daños

Altman
7 comentarios Facebook Twitter Flipboard E-mail

Estos días se encuentran las aguas revueltas en la industria tecnológica. No es para menos, pues a ChatGPT le ha salido competencia. Y no solo eso, ya que a diferencia del resto de alternativas que había presentes hasta el momento, DeepSeek ha lanzado un modelo de lenguaje equiparable al más potente de OpenAI hasta la fecha, lo ha ofrecido gratis y open-source a la comunidad, y los recursos que han utilizado para entrenarlo han sido ínfimos en comparación a las grandes sumas de dinero que Silicon Valley lanza hacia las tecnologías de IA.

DeepSeek R1, que es hasta el momento el modelo más capaz de la firma china, está haciendo ver al resto de usuarios y grandes tecnológicas que quizás la estrategia que estaban tomando empresas como OpenAI, Microsoft, Google, Meta o Nvidia no era del todo la acertada. Esta incertidumbre ha hecho dudar a los inversores, quienes hasta el momento lo daban todo por la IA, lo que ha supuesto el desplome de Nvidia en la bolsa con pérdidas que superan los 600.000 millones de dólares y perdiendo su puesto de compañía mejor valorada.

Un modelo que ha puesto patas arriba a la industria tecnológica

Ante tal despliegue de tecnología, OpenAI ya está haciendo control de daños.  En un intento por calmar las aguas, Sam Altman, CEO de OpenAI, ha publicado en redes estar impresionado con el modelo, recordando además que su compañía lanzará modelos mucho mejores:

“DeepSeek R1 es un modelo impresionante, sobre todo por lo que es capaz de ofrecer por su precio. Evidentemente, nosotros ofreceremos modelos mucho mejores y, además, ¡es legítimamente estimulante tener un nuevo competidor! Sacaremos algunos lanzamientos!”
Altman Haz clic en la imagen para ir a la publicación

A OpenAI no le queda otra que apechugar y continuar haciendo su trabajo. Pero una cosa es cierta en las palabras de Altman: la competencia se ha vuelto ahora mucho más cruenta, por lo que eso obligará a su compañía a ser más cauta aún, ya que acaban de presenciar que ahí fuera todavía hay alternativas que le pueden hacer frente de tú a tú a o1 y al resto de sus modelos de lenguaje. Además, también sirve de recordatorio para mostrar lo volátil que puede ser el éxito en el campo de la inteligencia artificial generativa, obligando a las empresas a estar en constante evolución.

Altman continua sus palabras asegurando que están “entusiasmados por continuar su investigación y hoja de ruta” y creen firmemente que “más potencia de computación es más importante que nunca para tener éxito en su misión”. El ejecutivo ha hecho un intento de ponernos los dientes largos al reconocer que “vamos a estar sorprendidos por los modelos de próxima generación que se avecinan”, mencionando además querer ofrecer a sus usuarios todas las capacidades de la AGI (Inteligencia artificial general) y “mucho más”.

Mientras tanto, en DeepSeek están afrontando este éxito inmediato con nuevas herramientas. Hace escasas horas conocíamos su nuevo modelo de generación de imágenes. Aunque no todo ha sido un camino de rosas estos días, ya que han sido el blanco de un ataque DDoS, según la compañía.

Con sede en China, DeepSeek ha logrado con R1 un modelo de lenguaje altamente capaz priorizando innovación antes que potencia de computación. Su modelo destaca por usar ‘Mixture of Experts’, una arquitectura que le permite utilizar solamente un pequeño subset de sus componentes (‘experts’) para cada tarea, en vez de hacer trabajar a todo el sistema al completo, reduciendo significativamente los costes energéticos y potencia de computación.

Alcanzando 671.000 millones de parámetros, este modelo es gratuito y abierto, lo que significa que cualquiera podrá examinarlo con mucho ojo, modificarlo o mejorarlo de forma independiente. Las empresas chinas parecen estar tomando una estrategia que pasa por lanzar modelos abiertos y gratuitos con el fin de incrementar su influencia a nivel global. También es un rumbo que puede atraer mucho talento de fuera, obteniendo así más recursos para que el país siga avanzando en esta carrera que, hasta hace unos días hubiésemos dicho que Estados Unidos tenía controlada y dominada.

Imagen de portada | TechCrunch y montaje propio

En Genbeta | La IA empaña el prestigio de los creadores de 'Magic' y 'D&D': los fans descubrieron que no todos sus diseños eran creados por humanos

Inicio