El nuevo GPT-5 impresiona a algunos y decepciona a otros en su primera prueba

En varias plataformas, los usuarios de ChatGPT expresaron su frustración por el hecho de que GPT-5 siguiera inventándose información y poniendo zancadillas a preguntas sencillas de matemáticas y ortografía.

El logotipo de OpenAI.
Por Emily Forgash
08 de agosto, 2025 | 09:48 PM

Bloomberg — Durante meses, Sam Altman, CEO de OpenAI, ha estado promocionando las capacidades de GPT-5, convirtiendo su lanzamiento en un momento clave para la compañía. Sin embargo, en las primeras 24 horas tras su lanzamiento, el nuevo modelo recibió críticas mixtas.

En su anuncio del jueves, OpenAI afirmó que el GPT-5 era mejor codificando y razonando problemas complejos, y lo promocionó como lo suficientemente avanzado como para convertir al chatbot ChatGPT en un experto de nivel doctoral. Algunos con acceso anticipado elogiaron el modelo, con salvedades. “Es mi nuevo modelo favorito”, escribió en un blog el desarrollador Simon Willison, calificándolo de “competente” y “ocasionalmente impresionante”. Y añadió: “No es una desviación dramática de lo que hemos tenido antes”.

PUBLICIDAD

Sin embargo, en varias plataformas de medios sociales, los usuarios de ChatGPT expresaron su frustración por el hecho de que GPT-5 siguiera inventándose información y poniendo zancadillas a preguntas sencillas de matemáticas y ortografía. Noah Giansiracusa, profesor asociado de matemáticas en la Universidad de Bentley, dijo que el lanzamiento le pareció “decepcionante”. Aunque hubo “algunas mejoras”, dijo, “fueron mucho menores de lo que esperaba”.

Ver más: GPT-5: seis motivos por los que el nuevo modelo de OpenAI importa, según Deutsche Bank

Al menos parte de la reacción podría deberse a la confusión sobre lo que sucede en segundo plano. A diferencia del software anterior de OpenAI, GPT-5 cambia automáticamente entre modelos con distintos niveles de sofisticación según la consulta. Este enfoque puede ayudar a maximizar los recursos informáticos de la empresa, pero también implica que los usuarios podrían no estar siempre familiarizados con la versión más potente de la tecnología de OpenAI.

PUBLICIDAD

Al pedirle que identificara cuántas veces aparece la letra “b” en “arándano”, por ejemplo, GPT-5 inicialmente dijo “tres” en una prueba. Sin embargo, cuando se le pidió que “pensara más”, GPT-5 pareció usar su modelo de razonamiento más avanzado y dio la respuesta correcta.

El viernes, Altman respondió a algunos comentarios y dijo que había un problema con el sistema. “GPT-5 parecerá más inteligente a partir de hoy”, dijo. “Ayer, el conmutador automático se averió y estuvo fuera de servicio durante gran parte del día, y el resultado fue que GPT-5 parecía mucho más tonto”.

Hay mucho en juego para el lanzamiento. OpenAI se esfuerza por mantenerse a la vanguardia de la creciente competencia en IA de sus rivales en EE.UU. y China. La compañía también lucha por convencer a empresas y usuarios particulares de que paguen por sus servicios premium para compensar la enorme inversión que realiza en talento, chips y centros de datos para impulsar el desarrollo de la IA.

La empresa con sede en San Francisco impulsó el auge de la IA generativa hace casi tres años con el lanzamiento de ChatGPT, que originalmente funcionaba con un modelo anterior llamado GPT-3.5. Desde entonces, la empresa ha lanzado una serie de sistemas cada vez más sofisticados, que incluyen múltiples opciones que imitan el razonamiento humano.

A medida que los sistemas de IA avanzan, se hace más difícil determinar con certeza cómo se comparan los distintos servicios. Al mediodía del viernes, GPT-5 había alcanzado la cima en varias categorías de LMArena, una popular clasificación de modelos de IA basada en la clasificación de los usuarios. Sin embargo, un punto de referencia diferente, ARC-AGI-2, sitúa a GPT-5 por detrás de la última versión de Grok de xAI de Elon Musk.

Ver más: OpenAI lanza modelo GPT-5 más potente para codificación y escritura

A falta de evaluaciones más definitivas, las guerras de modelos a veces se reducen a sensaciones. Y con casi 700 millones de personas que usan ChatGPT cada semana, es inevitable que algunos discrepen sobre cómo se siente el modelo. Además, se tarda más de un día en evaluar el valor de un nuevo sistema de IA en la vida personal y profesional de alguien.

Ethan Mollick, profesor de la Escuela Wharton de la Universidad de Pensilvania que experimenta frecuentemente con modelos de IA, se maravilló de la capacidad de GPT-5 para realizar investigaciones, elaborar respuestas escritas inteligentes y hacer que la programación sea sencilla, incluso para un novato.

“GPT-5 simplemente hace cosas, a menudo extraordinarias, a veces raras, a veces muy propias de la IA, por sí solo”, escribió en una entrada de blog. “Y eso es lo que lo hace tan interesante”.

En Reddit, sin embargo, las reacciones fueron muy distintas. Durante una sesión de “Pregúntame lo que quieras” el viernes en la plataforma, Altman respondió a las críticas de los usuarios, frustrados por no tener más voz y visibilidad sobre qué modelo responde a sus consultas. Altman afirmó que OpenAI tomaría medidas para abordar estas quejas, incluyendo una mayor transparencia.

En un momento dado, Altman respondió a la pregunta de un usuario de Reddit señalando que OpenAI considera que la calidad de escritura en una versión de GPT-5 es mejor que en GPT-4.5. Luego preguntó: “¿Lo consideras peor?”. Un usuario tras otro respondieron rápidamente: sí.

Lea más en Bloomberg.com

PUBLICIDAD