DeepSeek y Tsinghua desarrollan modelos de IA automejorables

Últimas cotizaciones

Bloomberg — DeepSeek está trabajando con la Universidad de Tsinghua con el objetivo de reducir el entrenamiento que requieren sus modelos de IA, en un esfuerzo por rebajar los costos operativos.

La startup de China, que sorprendió a los mercados con su modelo de razonamiento de bajo costo que se presentó en enero, ha colaborado con investigadores de la institución de Pekín en un documento en el que se describe un novedoso enfoque del aprendizaje de refuerzo para que los modelos sean más eficientes.

Ver más: Los inversionistas siguen llevando dinero a los ETF de IA, a pesar de retornos débiles

DeepSeek y Tsinghua desarrollan modelos de IA que se mejoran a sí mismos.Fotógrafo: Andrey Rudakov/Bloomberg.(Andrey Rudakov)

Este nuevo método tiene como objetivo ayudar a los modelos de IA a ajustarse mejor a los intereses humanos, recompensando las respuestas más precisas y coherentes, según los investigadores.

Se ha demostrado que el aprendizaje por refuerzo es efectivo para agilizar las tareas de inteligencia artificial en aplicaciones y ámbitos limitados.

Las más visitadas

Estados Unidos

Trump abre la puerta a imponer aranceles sobre aviones comerciales y motores a reacción

Estados Unidos

El elegido de Trump para la NASA respalda el método de financiación que benefició a SpaceX

Argentina

IPC: de cuánto fue la inflación de abril en Argentina, según el REM del BCRA

No obstante, su expansión a aplicaciones más generales ha demostrado ser todo un reto, y ese es el desafío que el equipo de DeepSeek trata de resolver con lo que llama “ajuste crítico autodirigido” (self-principled critique tuning).

Según el documento, la estrategia superó a los métodos y modelos actuales en diversas pruebas de referencia y el resultado fue un mayor rendimiento con menos recursos informáticos.

DeepSeek ha denominado a estos nuevos modelos DeepSeek-GRM, la abreviatura de “generalist reward modeling” (modelado de recompensa generalista), y los lanzará en código abierto, según la empresa.

Ver más: Industria IA de China se acelera tras DeepSeek: ¿cómo afecta esto a sus rivales occidentales?

Otros desarrolladores de IA, entre ellos el gigante tecnológico chino Alibaba Group Holding Ltd. (BABA) y OpenAI, con sede en San Francisco, también se están aventurando en una nueva frontera para mejorar el razonamiento y las capacidades de perfeccionamiento automático mientras un modelo de IA realiza tareas en tiempo real.

Meta Platforms Inc. (META), con sede en Menlo Park, California, lanzó su última familia de modelos de IA, Llama 4, durante el fin de semana, convirtiéndose en la primera en utilizar la arquitectura Mixture of Experts (MoE).

Los modelos de DeepSeek dependen significativamente de MoE para optimizar el uso de los recursos, y Meta comparó su nueva versión con la de la startup con sede en Hangzhou. DeepSeek no ha especificado cuándo podría lanzar su próximo modelo estrella.

Lea más en Bloomberg.com

DeepSeek y Tsinghua desarrollan modelos de IA automejorables

Estados Unidos

Estados Unidos

Argentina

Las noticias del día

DeepSeek

Inteligencia artificial

modelos

IA

Tsinghua

Tecnologia

Argentina

México

Argentina

México

Económicas e internacionales

Estados Unidos

Estados Unidos

Mundo

Negocios

Negocios

Negocios

Mundo

Mercados