Bloomberg — Casi dos años después del lanzamiento de ChatGPT de OpenAI, tuve mi primer momento verdaderamente “wow” por el frenesí de la inteligencia artificial.
Es cierto que me ha impresionado la capacidad de los chatbots para generar respuestas útiles y sintetizar información. Me he divertido con algunas de las imágenes que he creado con varias aplicaciones. Pero, sobre todo, me he acercado a la IA con una buena dosis de escepticismo, a menudo viendo más publicidad que sustancia, y aún así me resulta muy obvio cuando interactúo con una computadora y no con un humano.
Gran parte de eso cambió cuando pasé la semana pasada jugando con la actualización del modo de voz avanzado de ChatGPT . La función comenzó a implementarse para los suscriptores pagos la semana pasada, después de demoras iniciales debido a posibles problemas de seguridad. Esta semana, OpenAI dijo que estaba lanzando su asistente de voz para que las empresas y los desarrolladores lo usen en sus propias aplicaciones.
Esta asombrosa herramienta, que puede hablar 50 idiomas con una franqueza casi humana, tiene el potencial de cambiar para siempre la forma en que las personas de todo el mundo interactúan con la IA. También marca el comienzo de una nueva era de incertidumbre en el mercado laboral mundial .
La hazaña más asombrosa que encontré fue lo bien que dominaba los matices culturales y los idiomas distintos del inglés. Varias aplicaciones de traducción han existido durante un tiempo, pero muchas aún tienen dificultades para convertir el inglés a idiomas asiáticos en comparación con los europeos. Se han realizado mejoras a lo largo de los años, especialmente en los traductores de texto a texto. Pero el modo de voz avanzado de ChatGPT pudo pasar sin problemas de un idioma a otro con respuestas en vivo que sonaban humanas y errores mínimos.
Mantuve conversaciones con él en japonés y lo usé para practicar mi keigo , la forma honorífica más complicada que se usa en entornos formales y comerciales. Incluso pasó mi prueba habitual para traductores automáticos de japonés, reconociendo que un semáforo parpadea ao , o azul, y no verde. Para verlo por ti mismo, aquí hay un video visto casi 5 millones de veces en X, anteriormente Twitter, que muestra a ChatGPT recitando un cuento infantil japonés y cambiando su voz a la de un comentarista deportivo cuando se le ordena.
Cuando le pedí a ChatGPT que me ayudara a aprender mandarín, me ofreció información detallada sobre mis tonos de voz. Un analista de China comentó que usarlo para practicar chino hablado ha sido “nada menos que alucinante”.
Mi verdadero momento de sorpresa se produjo cuando le pedí que me hablara en pidgin hawaiano, una lengua criolla que surgió en las plantaciones de caña de azúcar de las islas en la década de 1830. No la había oído hablar desde que mis abuelos fallecieron hace aproximadamente 10 años.
La capacidad de ChatGPT de convertirse sin problemas en un camaleón cultural fue fascinante y fue la primera vez que sentí que no estaba hablando con una máquina. Incluso me sorprendí respondiendo como si fuera una persona, diciéndole a la herramienta “perdón por interrumpir” y “muchas gracias”.
No soy el único. El dominio que el modo de voz avanzado tiene de los dialectos hablados es desconcertante. El fundador de una startup jamaiquina compartió un clip de él mismo conversando con ChatGPT en el dialecto local. TikTok se ha inundado de videos que muestran a la aplicación hablando en todo tipo de dialectos, desde singlish hasta inglés vernáculo afroamericano.
La capacidad de ChatGPT para comunicarse en dialectos abre las compuertas para que más personas interactúen con la herramienta y la antropomorfice. Puede parecer un truco, pero cualquiera que haya viajado lejos de casa sabe que el idioma y la cultura salvan barreras. Escuchar a alguien que habla como tú, en cualquier idioma, crea instantáneamente una sensación de parentesco. Durante la mayor parte de la era de Internet, este tipo de matiz cultural era algo que las computadoras aún no podían capturar, lo que marcaba uno de los mayores diferenciadores entre un amigo y una máquina.
Pero el uso de dialectos con IA tiene posibles consecuencias. Un estudio de Nature publicado en agosto descubrió que los grandes modelos lingüísticos generan “decisiones racistas encubiertas” sobre las personas en función de sus dialectos en un experimento basado en texto. Los investigadores descubrieron que la IA tiene más probabilidades de sugerir que a los usuarios de inglés afroamericano “se les asignen trabajos menos prestigiosos, se les condene por delitos y se les condene a muerte” en comparación con los hablantes de inglés estadounidense estándar.
Por otra parte, OpenAI ha reconocido que las capacidades de audio, en concreto, de su último modelo podrían conllevar riesgos que aún no comprendemos del todo, como que las personas creen vínculos fuertes o que se produzca una “confianza cada vez más descalibrada” en los modelos de IA. La empresa ha observado que los usuarios aprovechan las funciones de audio utilizando un lenguaje que podría indicar que sienten conexiones con el modelo, y ha afirmado que es necesario realizar más estudios internos e independientes para “definir de forma más concreta esta área de riesgo”. Y la razón por la que el chatbot ahora suena tan parecido a un humano es en parte porque sus nueve voces están impulsadas por actores reales.
OpenAI tiene una serie de restricciones. ChatGPT respondió a algunas preguntas que le hice cambiando el tema, diciendo que sus pautas no le permiten responder. No puede cantar, imitar a otras personas ni ser demasiado coqueto. La versión actual también se abstuvo de traducir en vivo algo que no sea mi propia voz, como un discurso o un video, posiblemente para evitar un mayor escrutinio de derechos de autor. Los observadores más avispados han criticado su competencia en ciertos idiomas y dialectos. Debido a obstáculos regulatorios, el modo de voz avanzado aún no está disponible en la Unión Europea y algunos otros mercados.
La nueva capacidad de ChatGPT para romper barreras lingüísticas tiene enormes ventajas potenciales, tanto para las empresas como para las personas. Pero, por más fascinado que estuviera la semana pasada, de vez en cuando recibía una respuesta que me recordaba que era solo una aplicación y que no debería asignarle demasiada responsabilidad ni verla como un compañero humano. No pude evitar preocuparme por un futuro en el que la gente pudiera olvidarlo.
- Esta nota no refleja necesariamente la opinión del consejo editorial o de Bloomberg LP y sus propietarios.
Lea más en Bloomberg.com