La reciente presentación de DeepSeek R1, una inteligencia artificial hecha en China revolucionó el mercado global. Deepseek ha hecho caer las acciones de Nvidia, una de las empresas líderes del sector de la IA y pudimos comprobar sus increíbles capacidades en comparación con ChatGPT Plus. La IA asiática puso patas arriba en pocas horas a Wall Street.
Sorprende, sobre todo, quién hay detrás de esta increíble tecnología: un equipo de gente muy joven y con poca experiencia laboral en otras empresas. Mientras los jefes están quejándose de que la Generación Z no tiene la misma disciplina que ellos exigen, esta revolucionaria tecnología decidió apostar por la generación que ha crecido en un mundo digital y también por millennials.
En este reportaje vamos a analizar quiénes son algunas de las caras detrás de DeepSeek: su edad, estudios, dónde han trabajado (o hecho prácticas anteriormente), etc. Además, con esta revolución ha surgido un debate en redes sociales: muchas empresas multinacionales de EE.UU y de Europa están rechazando a profesionales chinos por temas geopolíticos y. así, desperdiciando muchísimo talento.
Mirando los perfiles de LinkedIn, tras esta revolución tecnológica hay jóvenes graduados de las mejores escuelas de China, como la Universidad de Pekín. En una entrevista el año pasado, Liang Wenfeng, su CEO describió lo que busca en los empleados: “Nuestros criterios de selección siempre han sido la pasión y la curiosidad”, dijo. “El deseo de muchas personas de investigar supera con creces su preocupación por el dinero”. Según las informaciones, la empresa tiene unos 300 empleados.
Confianza en el talento joven
Ya hace unas semanas, un medio de comunicación analizó esta empresa. Recordaba que la fuerza impulsora detrás del éxito de DeepSeek reside en su equipo de "jóvenes genios", como revelaron fuentes internas y análisis de medios de comunicación chinos. El fundador de la empresa, Liang Wenfeng, un ex estudiante de IA en la Universidad de Zhejiang, lidera un grupo de personas talentosas que son recién graduados o están comenzando sus carreras en IA.
Esta estrategia de contratación poco convencional prioriza la capacidad sobre la experiencia, lo que distingue a DeepSeek de otras empresas de IA locales. Entre los miembros destacados de DeepSeek se encuentran Gao Huazuo, un graduado en física de la Universidad de Pekín, y Zeng Wangding, que cursa un máster en el Instituto de IA de la Universidad de Correos y Telecomunicaciones de Pekín.
En una entrevista, Wenfeng afirmó que en su equipo "no hay magos", sino, en su mayoría recién graduados de las mejores universidades, candidatos a doctorado en su cuarto o quinto año y algunos jóvenes que se graduaron hace solo unos años. Además, ha explicado que el equipo detrás del modelo V2 no incluye a nadie que regrese a China desde el extranjero; todos son locales. "En lugar de necesitar un doctorado y años de experiencia en la industria para ser realmente útil" ha visto mucho potencial en gente "veinteañera" inteligente y hambrienta de aprendizaje y afirma que ha podido ver que China tiene muchas personas así.
Como publica un análisis a esta estrategia de contratación, en la industria de la IA, contratar a veteranos experimentados es la norma, y muchas empresas emergentes de IA chinas locales prefieren contratar investigadores senior o con doctorados en el extranjero. Sin embargo, DeepSeek va a contracorriente y favorece a los jóvenes sin experiencia laboral. Un cazatalentos que ha trabajado con DeepSeek reveló que DeepSeek no contrata personal técnico senior: "El máximo es de 3 a 5 años de experiencia laboral".
Liang Wenfeng también afirmó en una entrevista en 2023 que "la mayoría de nuestros puestos técnicos principales están ocupados por recién graduados o aquellos con uno o dos años de experiencia laboral". Y añaden los análisis que in experiencia laboral, ¿cómo selecciona DeepSeek a sus candidatos? Y la respuesta es, mirando el potencial.
"Al hacer algo a largo plazo, la experiencia no es tan importante; en comparación con eso, las habilidades fundamentales, la creatividad y la pasión son más importantes". Él cree que quizás los 50 mejores talentos de IA del mundo no estén actualmente en China, "pero podemos cultivar esos talentos nosotros mismos".
Quién es el CEO de DeepSeek
Como recuerda The Washington Post el hombre detrás de DeepSeek de China es un empresario de perfil bajo con experiencia en finanzas, no en IA. Liang nació en 1985 y creció en la provincia de Guangdong, en el sur de China, donde sus padres trabajaban como profesores de primaria, según información de medios locales.
Mostró talento en las matemáticas desde muy joven, de acuerdo con las informaciones que hay sobre él. Los medios chinos han informado que estudió ingeniería de la información en la Universidad de Zhejiang en Hangzhou, un centro tecnológico en el este de China donde se ubica Alibaba Group, el gigante chino del comercio electrónico.
La carrera de Liang comenzó con su trabajo en una industria completamente diferente: las finanzas.En 2015, Liang fundó High-Flyer, un fondo de cobertura cuantitativo que se basa en las matemáticas y la inteligencia artificial para desarrollar estrategias comerciales.
En 2017, la firma, que ahora atiende a más de 10.000 clientes, ya tenía contratado a un equipo de investigación de IA y utilizaba casi en su totalidad algoritmos de IA para sus operaciones, según su sitio web. En 2023, fundó DeepSeek, empresa con sede en Hangzhou dedicada al desarrollo de grandes modelos de lenguaje.
Algunos líderes de DeepSeek: la investigadora principal
La investigadora principal (como explican diversos medios) de DeepSeek AI de China es Luo Fuli. A principios de 2022, llamó la atención que había publicado 8 artículos de investigación relacionados con algoritmos de IA y aprendizaje profundo (deep learning) en la Universidad de Pekín, como parte de una reconocida conferencia. A mediados de 2022, se trasladó a DeepSeek como investigadora principal y ha estado allí desde entonces.
Se sabe que tiene 29 años de edad y que lidera un equipo dedicado a crear modelos de lenguaje de alto rendimiento que requieran menos recursos computacionales. En los medios chinos hablan de ella como "Genius AI Gal" y ha obtenido un amplio reconocimiento por sus contribuciones pioneras al procesamiento del lenguaje natural (PLN). Eso hizo que llamara la atención de grandes empresas como Alibaba o Xiaomi.
De acuerdo con el medio pakistaní Tribune en Alibaba, Luo trabajó como investigadora en la Academia DAMO, donde dirigió el desarrollo del modelo de preentrenamiento multilingüe VECO y ayudó a promover el proyecto de código abierto AliceMind. Recidió una tentadora oferta de dólares de Xiaomi, que le ofreció 10 millones de dólares, según la información publicada, pero Luo tomó la audaz decisión de dejar Alibaba en 2022 y unirse a DeepSeek.
De hacer prácticas en Nvidia a revolucionar la IA
DeepSeek ha alcanzado el éxito centrándose en algo que pocas empresas occidentales hacen: dar todo el protagonismo a gente joven y brillante. Por un lado, está Zizheng Pang, investigador, que está usando su perfil en la red social X para mostrar su orgullo de que DeepSeek sea la app más descargada. El mismo joven cuenta que antes trabajó en Nvidia, y que ha estudiado en la Universidad de Adelaide y en Monash (ambas en Australia). Zhiding Yu, un investigador senior y doctor que lleva en Nvidia desde 2018, decidió compartir su experiencia trabajando con Pang.
"Zizheng hizo prácticas en NVIDIA en el verano de 2023. Más tarde, cuando estábamos considerando hacerle una oferta de trabajo a tiempo completo, decidió unirse a DeepSeek sin dudarlo mucho. En ese entonces, el equipo multimodal de DeepSeek solo tenía 3 personas. Todavía estoy muy impresionado por la decisión de Zizheng en ese momento. Ha sido un importante colaborador de varios trabajos importantes en DeepSeek, incluidos DeepSeek-VL2, DeepSeek-V3 y DeepSeek-R1".
Y esta persona recuerda que "el caso de Zizheng es un ejemplo muy típico de lo que he presenciado en los últimos años. Muchos de nuestros mejores talentos provienen de China, y estos talentos no tienen por qué triunfar solo en una empresa estadounidense. En cambio, aprendemos mucho de ellos". Y añade que considera que si empresas como Nvidia siguen "inventando agendas geopolíticas y creando opiniones hostiles hacia los investigadores chinos, nos dispararemos en el pie y perderemos más competitividad".
De la universidad a DeepSeek
Otro ejemplo es Runxin Xu que, como él mismo explica en su perfil de github.io, trabaja como investigador en DeepSeek. Está involucrado en el desarrollo de la serie de modelos de DeepSeek, incluidos DeepSeek-R1, DeepSeek V1/V2/V3, DeepSeek Math, DeepSeek Coder y DeepSeek MoE.
Anteriormente, fue estudiante de maestría en el Instituto de Lingüística Computacional de la Facultad de Ingeniería Eléctrica, Computación y Ciencias de la Computación de la Universidad de Pekín y antes de esto, obtuvo su licenciatura en la Universidad Jiao Tong de Shanghái.
Se graduó en junio de 2023 y lleva en DeepSeek AI desde agosto agosto de 2023. También hizo un Posgrado de LLM. Metabit Trading, durante varios meses entre 2022 y 2023. Ha trabajado en sitios como ByteDance Search, desde enero a septiembre de 2022 y estuvo un tiempo en el motor de búsqueda en Douyin Mall.
Imagen destacada | DeepSeek, Xataka con Mockuuups Studio
Ver 6 comentarios