Bloomberg — OpenAI está lanzando una versión preliminar de un nuevo modelo de inteligencia artificial largamente esperado llamado GPT-4.5 después de encontrar obstáculos en el desarrollo del sistema de IA el año pasado.
En una publicación de blog el jueves, la startup de IA con sede en San Francisco dijo que GPT-4.5 es mejor para captar y responder a señales sutiles de las indicaciones escritas de los usuarios y es particularmente hábil para chatear, escribir y codificar. OpenAI también espera que el nuevo modelo invente cosas con menos frecuencia que su software anterior.
En un primer momento, OpenAI ofrece el modelo como una “vista previa de investigación” a un grupo limitado de desarrolladores de software y usuarios que pagan US$$200 al mes por una suscripción a ChatGPT Pro. La compañía planea incorporar los comentarios de las primeras personas que lo prueben antes de implementarlo para un público más amplio.
OpenAI inició un frenesí en torno a la IA generativa a fines de 2022 con el lanzamiento de ChatGPT, que originalmente estaba impulsado por un modelo anterior llamado GPT-3.5. Desde entonces, la empresa ha lanzado una serie de sistemas cada vez más sofisticados, incluidas múltiples opciones que imitan el proceso de razonamiento humano. Pero OpenAI también se enfrenta a una mayor competencia de la emergente china DeepSeek, xAI de Elon Musk y Anthropic, cada una de las cuales ha presentado nuevos modelos en las últimas semanas.
Nick Ryder, vicepresidente de investigación de OpenAI, dijo a Bloomberg News que espera que GPT-4.5 represente un salto tan grande en capacidades desde su modelo GPT de gama alta existente como el que la empresa vio desde GPT-3.5 hasta GPT-4, que salió a principios de 2023.
Lea más: OpenAI prohíbe cuentas que aparentemente trabajaban para una herramienta de vigilancia china
Sin embargo, construirlo resultó ser un desafío. El modelo, al que se hace referencia como Orion dentro de la empresa, no alcanzó los puntos de referencia de rendimiento deseados por OpenAI el año pasado, informó anteriormente Bloomberg News. A fines del verano, por ejemplo, Orion se quedó corto al intentar responder preguntas de codificación para las que no había sido entrenado, según personas familiarizadas con el asunto. Un problema al que se enfrentaron OpenAI y otros desarrolladores fue encontrar nuevas fuentes de datos de entrenamiento de alta calidad que no habían sido explotadas para desarrollar sistemas de IA más avanzados.
OpenAI se basó en un proceso llamado post-entrenamiento, durante el cual incorpora comentarios humanos para mejorar las respuestas y refinar el tono de cómo el modelo debe interactuar con los usuarios, entre otras cosas. La empresa también ideó nuevas formas de entrenar el modelo utilizando datos derivados de la información utilizada para entrenar su modelo GPT-4.0 existente, dijo Mia Glaese, también vicepresidenta de investigación de la empresa.
El lanzamiento de GPT-4.5 marcará el fin de una era para OpenAI. En una publicación en X a principios de este mes, el director ejecutivo de OpenAI, Sam Altman, dijo que el modelo sería el último que la empresa presentaría que no utiliza potencia informática adicional para reflexionar sobre las consultas antes de responder. OpenAI ha adoptado este enfoque de razonamiento con algunos de sus modelos más nuevos, incluidos o1 y o3.
En el futuro, OpenAI avanzará para combinar sus modelos GPT con su nueva serie de modelos o para construir sistemas de IA que puedan determinar automáticamente cuánto tiempo deben reflexionar sobre una consulta antes de dar una respuesta. El objetivo, dijo Altman, es simplificar la experiencia para que los usuarios no se vean obligados a elegir entre una lista de opciones cada vez más complicada.
Lea más en Bloomberg.com