El modelo de inteligencia artificial DeepSeek, propiedad de la empresa del mismo nombre, ha despertado un gran interés entre los usuarios y sin duda es uno de 'los temas' del principios de 2025 por su gran repercusión. Es tal que superó a ChatGPT en los primeros puestos de descargas dentro de la App Store y la Play Store. Pero... ¿qué es DeepSeek?

Esta empresa no es totalmente nueva, sino que meses atrás de este 'boom' de atención ya comenzaba a sonar con mucha fuerza. Una compañía con sede en China que se ha planteado rivalizar con las principales IA 'made in USA', consiguiendo un gran resultado.

Qué es DeepSeek

Como decimos, DeepSeek es el nombre de una emprea con sede en China que cuenta con una inteligencia artificial que recibe el mismo nombre. Una IA generativa que rivaliza contra Gemini o ChatGPT que destaca por contar con una arquitectura MoE (Mixture of Experts) que está revolucionando el campo de las IA.

MoE es una gran novedad, puesto que implica a diferentes modelos que están especializados en una tarea concreta. Esto hace que cada orden de entrada se vaya a asignar "a un experto" en concreto para ofrecer un resultado muy preciso. Además, también integra LLM (Large Language Model) para brindar unos resultados mucho más naturales en sus respuestas.

Algo que ha llamado mucho la atención es que este modelo de IA es de código abierto, haciendo que cualquier persona pueda entrar en sus entrañas para desarrollarla en una línea concreta. De esta manera, un programador puede descargarla de GitHub y comenzar a editar sus archivos con el objetivo de destinarla para una actividad concreta.

El código abierto de esta manera garantiza la innovación y es un gran beneficio para la sociedad. Esto rivaliza con las IA tradicionales que son de código cerrado y nos hacía pensar que esto aumentaba su calidad. Ahora vemos que no es así.

Además de ser de código abierto, también es gratuita. No hace falta pagar para acceder a alguno de sus modelos. Ni siquiera al modelo más avanzado R1. Simplemente, se tiene que acceder a su web o descargar la aplicación para comenzar a introducir los prompts que queramos.

Los dos modelos disponibles de DeepSeek: V3 y R1

Ahora mismo DeepSeek cuenta con dos modelos diferentes. El primero de ellos es DeepSeek V3 que se ha enfrentado de manera directa a GPT-4o o Llama 3.1 consiguiendo superarlos en pruebas de programación.

Pero por lo que destaca DeepSeek es por la eficiencia. En este caso DeepSeek requirió "solo" 5.5 millones de dólares para entrenarse con 2.048 GPU y 2.788 millones de horas. Algo que dista con el entrenamiento de GPT-4 que necesitó 80 millones de dólares. Esto hace que sea mucho más barata y eficiente que sus competidores.

Como modelo más reciente tenemos a DeepSeek R1 que llega especializado en razonamiento para poder trabajar en pruebas lógicas, problemas matemáticos o de programación. El resultado también ha sido realmente bueno en los benchmarks que ha igualado en rendimiento a las IA que estaban dominando hasta ahora.

Gráfica comparativa del precio por 1 millón de Tokens entre las IA. Cuanto más bajo mejor. Extraída de Artificial Analysis

Igual que V3, R1 es mucho más eficiente que sus competidores como ChatGPT o1, con un 95% menos de coste y 671.000 millones de parámetros. Para poner cifras, en pruebas matemáticas MATH-500 R1 ha conseguido un acertar en un 97,3% de los casos mientras que el modelo de OpenAI ha acertado en el 96,4%.

Pero DeepSeek no es perfecta en términos generales. Está sometida a la regulación de China, y esto quiere decir que no puede hablar de ciertos temas en concreto. El conflicto entre Taiwán y China o Tiananmen son temas vetados, y es que aunque genera el texto de respuesta, al terminar decide borrarlo por completo y mostrar un mensaje en el que avisa que no puede ayudarnos con este tema.

Esta es la parte negativa que venga directamente desde China donde debe acogerse a las normas del Gobierno de este país que son realmente restrictivas en materia de geopolítica.

Cómo se puede usar DeepSeek

Además de destacar por tener una estructura novedosa como es MoE, también DeepSeek ha destacado por contar con un modelo de entrenamiento diferente. Este se ha basado en usar datos que no estaban etiquetados, sino que se le dan los datos en brutos para que aprenda por el método de 'prueba y error'.

De esta manera, el principio los resultados eran erráticos, pero poco a poco fue aprendiendo a cómo debía actuar y a perfeccionar las respuestas que iba dando. El resultado que tenemos ya vemos que es realmente bueno y abre la puerta nuevamente a que sea más eficiente la IA.

Para poder usar la IA no hay que hacer nada extraño. Encontramos una interfaz muy similar a la de OpenAI donde hay un cuadro de diálogo donde poder introducir el prompt que queramos. Obviamente, cuanto más detallado, mucho mejor va a ser la respuesta. Y siempre se va a poder usar lenguaje natural para expresarnos con ella sin buscar palabras técnicas.

Qué hacer con DeepSeek

Con DeepSeek vas a poder actuar como si fuera otra IA cualquiera como ChatGPT. Tiene la capacidad de responder a (casi) cualquier cosa que le preguntes como ya hemos visto en la comparativa entre DeepSeek y ChatGPT.

Más o menos completa la situación, esta IA te va a poder ayudar a la hora de planificarte, explicarte un concepto que no tengas claro, crear tablas, menús, formas de entrenamiento y un largo etcétera que se acaba en el final de tu creatividad.

Lo único que no vas a poder hacer es generar imágenes al no contar con esa tecnología integrada, y tampoco vas a poder analizar imágenes. DeepSeek está limitada a subir archivos pero con el único fin de extraer texto de ellas. Y nada más.

También vas a poder estar al tanto de la actualidad. En el cuadro de diálogo de DeepSeek vas a poder encontrar un botón que dice 'Search'. Al pulsarlo, la IA va a poder buscar en internet sobre el tema que le hayas preguntado, como por ejemplo la actualidad del día de hoy. De esta manera, no se basará en los conocimientos almacenados que no están del todo actualizados.

También cuenta con el botón 'DeepThink R1' que hará que la IA literalmente piense en el prompt que le hemos dado antes de generar una respuesta. Un pensamiento que podrás leer en una fuente diferente, más discreta. Pero lo que conseguiremos con esto es contar con un resultado mucho más preciso.

