El tema del momento en el campo tecnológico sin duda es DeepSeek. Un chatbot de IA que llega directamente desde China que se ha enfrentado directamente a ChatGPT dando un resultado realmente bueno y con un mayor rendimiento. Algo que ha amenazado el dominio de las grandes tecnológicas de Estados Unidos y que ha provocado una gran debacle en las bolsas.

Al igual que otras inteligencias artificiales, es mucha la información que compartimos a través de los diferentes prompts. En muchos casos información personal como nuestras costumbres, los viajes que tenemos pensados realizar y hasta introducimos imágenes con el objetivo de que las analice. Pero… ¿qué hacen con toda esta información?

Un vistazo a… Cómo mejorar la SEGURIDAD EN INTERNET: VPN, DNS y páginas con HTTPS

Usar DeepSeek es sinónimo de dar todos nuestros datos

Esta misma pregunta nos la hicimos con ChatGPT tras ver que estábamos pasándonos con la información que le estábamos proporcionando. Incluso muchas empresas prohibieron su uso en el ámbito laboral para evitar que se filtrara la información confidencial con la que se estaba trabajando en ese momento. Ahora esta misma pregunta nos la hacemos con DeepSeek: ¿desaparece todo lo que le decimos después de introducir el prompt o se queda almacenado para una tarea secundaria?

Para poder responder a esta pregunta nos tenemos que ir a la política de privacidad de la compañía y la respuesta es clara: recopila una gran cantidad de datos de todo lo que hacemos en la web del chatbot. Toda esta información se recopila por parte de dos empresas: Hangzhou DeepSeek Artificial Intelligence Co., Ltd. y Beijing DeepSeek Artificial Intelligence Co., Ltd.

La información que "interesa" a las empresas detrás de DeepSeek son todos los chats que se introducen (además de la información personal que proporcionamos cuando nos registramos). Esto incluye los chats, los textos generados, los audios y archivos que se carguen, el historial de uso...

Pero no queda aquí. También tiene la capacidad de recopilar todos los datos que se envíen a la compañía con el objetivo de conseguir algún tipo de asistencia técnica. Tampoco nos podemos detener aquí, ya que también existe un apartado denominado "información recopilada automáticamente" done se va a agrupar la dirección IP, las cookies, los datos de diagnóstico y lo más grave de todo: las pulsaciones de las teclas. Todo esto asociado a un ID de usuario.

Toda esta información tiene un valor realmente alto, y es crítica. Con todos estos datos lo que se hace es entrenar al modelo de IA y también se habla de "supervisión de interacciones" lo que sugiere que alguien esté revisando lo que escribimos.

Y aunque esto parece realmente abusivo por parte de esta empresa, la realidad es que todos los datos se van a poder compartir con otras compañías del mismo grupo corporativo de DeepSeek. Algo ideal para poder cruzar la información generada en DeepSeek con la generada en otra plataforma. Ya que toda esta se asocia a un ID e usuario concreto.

Además de ello, también se apunta a la posibilidad de compartir la información con las autoridades locales como el gobierno de China. Esto ya fue causa de graves problemas con otras aplicaciones chinas como TikTok. El hecho de que tuviera la obligación de compartir los datos relevantes con el gobierno Chino hizo que Estados Unidos alertara sobre el peligro en el campo de la seguridad nacional, ya que veían como los datos de sus usuarios eran tratados por las autoridades de otros países.

La Unión Europea no tardará en actuar

Ante esta gran cantidad de datos que le estamos proporcionando a DeepSeek es imposible no pensar en lo que dirá la Unión Europea. La UE cuenta con unas políticas muy estrictas en materia de protección de datos que ya causó muchos problemas a diferentes compañías tecnológicas de Estados Unidos cuando quisieron traer sus productos a España, por ejemplo.

DeepSeek, igual que las otras, va a estar obligada a cumplir con el RGPD pese a contar con los servidores en China. Esto mismo lo vimos con ChatGPT en Italia donde se llegó a prohibir su uso hasta que se adaptara a la normativa europea en materia de protección de datos.

Este repunte de popularidad, y sobre todo tras analizar la cantidad de información que recopila, nos hace pensar que la UE no tardará en investigar a DeepSeek para que se ajuste a la normativa. Sobre todo cuando no se encuentra opción para rechazar que nuestros datos se utilicen para mejorar el funcionamiento del modelo o tener una forma fácil de eliminar los datos que tenga la compañía de nosotros. Para ello solo se va a poder contactar con ellos a través de los cauces disponibles.

Usar DeepSeek de manera offline

Para poder evitar esta filtración de datos, la solución pasa por usar el modelo de DeepSeek de manera offline. En las últimas horas, hemos visto como han aparecido diferentes tutoriales para poder descargar de manera local la inteligencia artificial para usarla de manera segura. En Reddit sin ir más lejos han aparecido más hilos, así como diferentes vídeos en YouTube.

En uno de estos hilos se explica como para poder tener la IA offline se puede descargar la aplicación de Cursor.AI y dentro de esta instalar CodeGPT. Una vez hecho esto, se requiere también tener instalado Ollama para poder ejecutar el código de DeepSeek de manera local.

Una vez hecho esto, ya se puede entrar en la app de Cursor.AI, posteriormente en CodeGPT y ahí debe aparecer ya Ollama. Dentro de Ollama es donde vamos a poder buscar el modelo de DeepSeek R1 para descargarlo (es importante elegir qué entrenamiento quieres instalar) y ya se puede comenzar a usar.

Vía | Xataka

Imágenes | Onur Binay Ricardo Vitaly Gariev

En Genbeta | La inteligencia artificial contribuye a la desigualdad social: hay IA para pobres e IA, muchísimo más potente, para ricos