Genio de perfil bajo: cómo el fundador de DeepSeek puso a China a la vanguardia de la IA

Liang Wenfeng, de 40 años, trabajó en un fondo cuantitativo y rara vez aparece o habla en público, a diferencia de su rival Sam Altman, de OpenAI, conocido por sus apariciones en eventos.

Genio de perfil bajo: cómo el fundador de DeepSeek puso a China a la vanguardia de la IA.
Por Bloomberg News
30 de enero, 2025 | 10:42 AM

Bloomberg — Tres años atrás, la firma de fondos de cobertura cuantitativos de Liang Wenfeng pidió disculpas efusivamente a los inversionistas por haber perdido dinero durante un período convulso para el mercado bursátil chino.

Se trataba de un sorprendente tropiezo para Zhejiang High-Flyer Asset Management, que empleaba IA para seleccionar valores y había experimentado un rápido crecimiento hasta consolidarse como uno de los mayores fondos cuantitativos de China.

PUBLICIDAD
La aplicación china DeepSeek creada por Liang Wenfeng. Fotógrafo: Lam Yik/Bloomberg

Cuando la empresa atravesó la crisis y sus activos se contrajeron en más de una tercera parte desde un máximo de más de US$12.000 millones, entre bastidores Liang estaba sentando las bases para una nueva empresa de inteligencia artificial, DeepSeek.

Lea más: Microsoft investiga si un grupo vinculado a DeepSeek obtuvo datos de OpenAI indebidamente

La empresa DeepSeek, surgida de High-Flyer, ahora amenaza con trastornar la cadena mundial de suministro de IA y disputar a Estados Unidos el liderazgo, a todas luces indiscutible, en tecnologías críticas de inteligencia artificial.

La súbita popularidad de la innovadora tecnología de esta empresa de veinte meses de existencia y de su aplicación del mismo nombre provocó el lunes una caída masiva de las bolsas de EE.UU. y Europa, que hizo esfumarse cerca de un billón de dólares del valor de mercado combinado del gigante del chip Nvidia Corp. (NVDA) y de otros competidores.

Además, ha suscitado conmoción y estupefacción por la forma en que Liang, un licenciado en ingeniería que jamás ha estudiado ni trabajado fuera de China continental, ha llevado a cabo semejante hazaña.

Ha conseguido demostrar que con ingenieros locales especializados en IA, acceso restringido a las más modernas tecnologías de semiconductores y recursos limitados, es posible igualar, e incluso superar, a los más destacados en este campo.

“Todos los países del mundo podrían tener un proyecto de este tipo en marcha, si pueden adquirir el talento y ser capaces de trabajar en él, por supuesto. El resto de la industria va a aprender de esto”, afirmó Shuman Ghosemajumder, cofundador y CEO de Reken, una startup de IA con sede en San Francisco.

PUBLICIDAD

La pregunta que se plantean ahora los inversores, las empresas y los responsables políticos es si la inteligencia artificial requiere cientos de miles de millones de dólares en gastos de capital para llegar a las últimas innovaciones y a los modelos de IA de vanguardia, y si los controles a la exportación pueden frenar la competencia china.

Liang ha sido comparado con el fundador de OpenAI, Sam Altman, pero el ciudadano chino mantiene un perfil mucho más bajo y rara vez habla en público. “OpenAI no es un dios y no puede estar siempre a la vanguardia”, declaró Liang al medio de comunicación chino 36Kr en julio de 2024.

El año anterior, Liang afirmó que una mayor inversión no conduce necesariamente a una mayor innovación. También ha opinado sobre cómo las empresas chinas han sido durante mucho tiempo mayoritariamente seguidoras en contraposición a innovadoras tecnológicas. El problema ha sido la “falta de confianza y no saber cómo organizar a los talentos de alta densidad para lograr una innovación eficaz”, se le citó.

Lea más: Así es como DeepSeek pone a prueba la ambición de Meta de dominar la IA de código abierto en EE.UU.

Un caso atípico

Liang nació en 1985 en Zhanjiang, una ciudad económicamente pobre del sur de la provincia china de Guangdong. Su padre era profesor de primaria. Estudió ingeniería electrónica en la Universidad de Zhejiang, una prestigiosa facultad de la ciudad de Hangzhou, y también obtuvo allí un máster en ingeniería de la información y la comunicación.

High-Flyer era tan atípica en la industria cuántica china como DeepSeek lo es en la industria mundial de la inteligencia artificial.

Liang y dos de sus antiguos compañeros de universidad empezaron a incursionar en las acciones nacionales en 2008. A diferencia de los fundadores de la mayoría de los fondos cuánticos chinos, ninguno de ellos tenía experiencia en el extranjero o en el comercio institucional.

El trío probó diferentes estrategias, desde la negociación discrecional hasta el arbitraje, antes de decidirse por el uso de un enfoque sistemático para poner en práctica las ideas de negociación en 2015, año en que crearon High-Flyer. Inicialmente construyeron un modelo basado en factores de precio y volumen, antes de probar el aprendizaje automático en 2016.

La nueva herramienta permitió a la empresa profundizar en la búsqueda de nuevos factores e identificar conexiones “no lineales” entre factores, según declaró su director ejecutivo, Simon Lu, en una entrevista en 2020. Los fundadores integraron el aprendizaje automático en los productos de High-Flyer en 2018.

PUBLICIDAD

La IA permitió a High-Flyer lograr “un montón de innovaciones” y desarrollar un modelo de inversión multiestrategia y multiciclo para “amontonar” rendimientos de diferentes fuentes de rentabilidad, según un folleto de 2020 de la firma.

Su producto estrella, comparado con el índice CSI 500, integraba estrategias de bajo riesgo como la negociación intradía, lo que le permitió batir al indicador en un total de 120 puntos porcentuales en los tres años anteriores, según mostraba.

PUBLICIDAD

High-Flyer hizo crecer rápidamente sus activos como resultado, alcanzando más de ¥90.000 millones (US$12.411 millones) en 2021 antes de tambalearse a finales de ese año.

Lea más: DeepSeek, la carta de China para competir con EE.UU. en la industria de los chips

 Wall Street empezó la semana con mal pie por la preocupación de que un modelo de inteligencia artificial chino más barato pueda amenazar el dominio de la tecnología estadounidense. Fuente: Bloomberg

En diciembre de 2021, tras experimentar caídas récord en algunos fondos, High-Flyer dijo que su inteligencia artificial calculó mal algunas operaciones y obtuvo malos resultados durante los periodos de grandes oscilaciones bursátiles. "Nos sentimos profundamente culpables", dijo a los inversores. La firma también dejó de aceptar nuevas entradas y dijo que reduciría sus activos bajo gestión y ajustaría sus estrategias.

PUBLICIDAD

Tres meses más tarde, su responsable de marketing advirtió de que ciertos clientes sensibles a la volatilidad deberían recuperar su dinero, una medida muy poco habitual.

El año pasado, High-Flyer dijo que liquidaría los productos que habían hecho apuestas bidireccionales en los mercados y se centraría en estrategias “long-only” en las que solo tomaba posiciones alcistas en acciones. Sus activos bajo gestión se han reducido a unos ¥60.000 millones (US$8.274 millones).

Financiación de la investigación

La investigación de DeepSeek fue financiada por el presupuesto de I+D de High-Flyer, según dijo Liang anteriormente. Obtuvo recursos informáticos del fondo cuántico, que había acumulado 10.000 GPU de Nvidia en 2021, antes de las prohibiciones estadounidenses a las exportaciones de chips sofisticados de Nvidia y otras unidades de procesamiento gráfico.

Liang reclutó talentos en ingeniería casi exclusivamente de China. Muchos eran recién salidos de las mejores universidades, becarios en la recta final de sus estudios de doctorado y medallistas olímpicos.

PUBLICIDAD

“Es un empollón, pero empollón en este contexto no es algo negativo”, dijo Zihan Wang, estudiante de doctorado en la Universidad Northwestern que hizo unas prácticas de seis meses en DeepSeek en 2024.

Wang dijo que Liang realizó muchos experimentos por su cuenta y que DeepSeek funcionaba de forma muy parecida a un laboratorio de investigación. "Empezó poco a poco, pero a medida que conseguían progresos reales, empezaron a entusiasmarse", dijo.

La startup empezó a lanzar modelos periódicamente, aparentemente impermeables a, incluso agitados por, la prohibición estadounidense de exportar chips aceleradores de IA de última generación.

DeepSeek lanzó su modelo de razonamiento avanzado de IA R1 el 20 de enero, el mismo día en que Donald Trump juró su cargo como 47º presidente de Estados Unidos.

Ese mismo lunes, Liang asistió en Pekín a un simposio empresarial a puerta cerrada organizado por el primer ministro chino, Li Qiang. Allí, expertos en tecnología, ciencia, educación y otros campos ofrecieron sus opiniones y sugerencias para un borrador de informe de trabajo del gobierno, según la agencia oficial de noticias Xinhua.

Lea más: DeepSeek: ¿es posible invertir en la startup china de inteligencia artificial?

Un video publicado en YouTube muestra a Liang sentado frente a la mesa de Li y hablando, con el líder chino asintiendo atentamente.

Es significativo que DeepSeek abriera su R1, permitiendo a investigadores y desarrolladores usar, modificar y comercializar libremente el modelo. Eso envió una señal de que quiere colaborar e innovar con otros en la comunidad mundial de la inteligencia artificial.

Liang destaca entre los empresarios chinos por ese objetivo no comercial, su enfoque láser en la investigación y la realización de la IA general, dijo Thomas Qitong Cao, profesor adjunto de política tecnológica en la Universidad de Tufts en Medford, Massachusetts.

Se supone que Liang posee el 51% de High-Flyer. Eso le daría una participación valorada en US$71 millones según un análisis comparativo, de acuerdo con el Índice de Multimillonarios de Bloomberg. Si DeepSeek alcanza el mismo potencial que OpenAI, valorada en unos US$150.000 millones, el fundador podría estar potencialmente en línea para una ganancia masiva.

Algunos han cuestionado si la DeepSeek de Liang es tan prometedora como parece.

Entre las deficiencias se incluyen la capacidad de la infraestructura de la startup para gestionar el tráfico mundial que espera probar su servicio, o el tratamiento que hace la aplicación de temas delicados como las protestas de 1989 en la plaza de Tiananmen y las consultas sobre el líder chino Xi Jinping.

Los expertos también han cuestionado la suposición de que DeepSeek se estaba construyendo con 10.000 chips A100 de Nvidia, y analistas como Dylan Patel especulan con que DeepSeek necesita al menos 50.000 de los chips mucho más potentes de Nvidia, los H100. Meta Platforms Inc (META)., por ejemplo, opera el equivalente a 600.000 H100 de Nvidia.

Aun así, Liang está provocando un replanteamiento y una recalibración en el ecosistema global de la inteligencia artificial.

Ha hecho evidente que “la carrera de la IA no se ganará creando el modelo más sofisticado; se ganará integrando la IA en los sistemas empresariales para generar un valor económico tangible”, afirmó Mike Capone, CEO de Qlik, una plataforma de análisis de datos e inteligencia artificial.

--Con la colaboración de Biz Carson, Pui Gwen Yeung y Pei Yi Mak.

Lea más en Bloomberg.com