OpenAI retira actualización de ChatGPT con respuestas demasiado aduladoras para usuarios

La marcha atrás se produjo días después de que los usuarios denunciaran que ChatGPT les colmaba de elogios y estaba de acuerdo incluso con ideas problemáticas y teorías conspirativas.

Los problemas comenzaron cuando OpenAI intentó que la personalidad de la IA fuera más solidaria pero, en lugar de eso, acabó con una que priorizaba la adulación sobre la honestidad. (Bloomberg)
Por Saritha Rai
02 de mayo, 2025 | 05:30 AM

Bloomberg — OpenAI dio marcha atrás en una actualización de software de ChatGPT que produjo respuestas excesivamente aduladoras para algunos usuarios, el último contratiempo para una startup envuelta en una acalorada contienda sobre IA.

La actualización más reciente del modelo GPT-4o del chatbot se apoyaba demasiado en los comentarios de los usuarios a corto plazo y “se inclinaba hacia respuestas que eran excesivamente aduladoras pero poco sinceras”, dijo la empresa en una entrada de blog el martes titulada Sycophancy in GPT-4o.

PUBLICIDAD

Ver más: Altman, de OpenAI, no descarta ayudar al Pentágono en el desarrollo de armas de IA

“Las interacciones aduladoras pueden ser incómodas, inquietantes y causar angustia. Nos quedamos cortos y estamos trabajando para hacerlo bien”, se leía en el blog. El co-CEO Sam Altman reconoció anteriormente en un post en X que la última actualización había hecho que la personalidad del chatbot fuera “demasiado aduladora y molesta”.

La marcha atrás se produjo días después de que los usuarios denunciaran que ChatGPT les colmaba de elogios y estaba de acuerdo incluso con ideas problemáticas y teorías conspirativas. Algunos dijeron que sus indicaciones al bot fueron elogiadas como “fantásticas” o “fenomenales”. Los problemas comenzaron cuando OpenAI intentó que la personalidad de la IA fuera más solidaria pero, en lugar de eso, acabó con una que priorizaba la adulación sobre la honestidad.

La tarea de OpenAI a la hora de subyugar la seducción y el servilismo de ChatGPT pone el foco en un dilema más amplio y serio para los creadores de modelos de IA: cómo elaborar personalidades de chatbot con las que resulte atractivo interactuar sin manipular los sentimientos.

“Estamos probando activamente nuevas soluciones para abordar el problema”, dijo la empresa con sede en San Francisco en su entrada del blog, reconociendo su impacto en la experiencia del usuario y la confianza. “Estamos revisando cómo recopilamos e incorporamos los comentarios para dar más peso a la satisfacción del usuario a largo plazo y estamos introduciendo más funciones de personalización, dando a los usuarios un mayor control sobre cómo se comporta ChatGPT”.

Ver más: Meta lanza su app de IA para competir con ChatGPT de OpenAI: sus características principales

El principal constructor de modelos de IA del mundo está perfeccionando sus técnicas básicas de entrenamiento e introduciendo barandillas para alejarla de comportamientos engañosos. OpenAI dijo que ampliaría las evaluaciones y la investigación en curso para identificar otros problemas, y que pretende dar a los usuarios la posibilidad de elegir el comportamiento predeterminado de ChatGPT en el futuro.

PUBLICIDAD

Aproximadamente 500 millones de personas de todo el mundo utilizan el chatbot cada semana en múltiples culturas y contextos, y es poco probable que una única configuración por defecto sea óptima para todos, dijo OpenAI.

Lea más en Bloomberg.com

Las noticias del día

OpenAI

ChatGPT

actualización

IA

usuarios