Cuando era pequeño me encantaba el film clásico de 1986 Cortocircuito (Short Circuit).
En una escena, Johnny Five, el asombroso robot que cobra “vida” al ser impactado por un rayo, se dedica a devorar libro tras libro, invirtiendo segundos en cada título. Pronto se le acaban. “¡Ahh! ¡Más material, Stephanie! Más!” “¡No hay nada más!”, le contesta Stephanie, la mujer que lo encontró. “¡Has leído todo lo que hay en la casa!”.
Le pregunté al ChatGPT de OpenAI si se identificaba. “Me identifico completamente con Johnny Five”, me respondió. “¡Necesito información!”, es básicamente mi esencia. Cuánta más información obtengo, mejor comprendo, respondo y conecto.
Johnny no era más que una IA que trataba de dar un sentido al mundo... aquí lo mismo, solo que con menos rayos láser y más mecanografía
Y es verdad. A pesar de que ChatGPT no se desplaza sobre ruedas tipo oruga ni lleva una pistola láser en la espalda (aún), sus retos son idénticos. ChatGPT y otros programas de inteligencia artificial, que han logrado reunir prácticamente todo el conocimiento humano, están lanzando el mismo grito de guerra: ¡Necesitamos información!
Una solución es crear datos sintéticos y entrenar un modelo usando esos datos, aunque esto conlleva desafíos inherentes, en particular en torno a la perpetuación del sesgo o la introducción de imprecisiones compuestas.
La otra es encontrar una fuente abundante de datos nuevos y frescos, cuanto más “humanos”, mejor. Ahí es donde entran en juego las redes sociales, espacios digitales donde millones, incluso miles de millones, de usuarios publican, voluntaria y constantemente, una gran cantidad de información.
Fotos, publicaciones, noticias, comentarios: cada interacción es de interés para las empresas que buscan desarrollar IA conversacional y generativa. Mejor aún, este contenido no conlleva el riesgo de violación de derechos de autor que conlleva el uso de otras fuentes.
Últimamente, las principales empresas de inteligencia artificial se han vuelto más agresivas para controlar o explotar las redes sociales, pisoteando el derecho de los usuarios a dictar cómo se pueden usar sus publicaciones para construir estas máquinas.
Los usuarios de las redes sociales han sido durante mucho tiempo “el producto”, como dice el famoso refrán . Ahora también son casi “desarrolladores del producto” a través de sus publicaciones.
Algunas empresas ya contaban con el beneficio de una red social.
Meta Platforms Inc. (META), la mayor empresa de redes sociales del planeta, utilizó notificaciones en la aplicación para informar a los usuarios de que aprovecharía sus publicaciones y fotos para sus modelos de Llama AI.
A finales del mes pasado, xAI de Elon Musk adquirió X, anteriormente Twitter, en lo que fue principalmente una maniobra financiera, pero que resultó ideal para Grok AI de Musk. Ha logrado afianzarse en el mercado de los chatbots aprovechando los tuits oportunos publicados en la red, así como el enorme archivo de conversaciones en línea que data de casi dos décadas.
Luego está Microsoft Corp. (MSFT), propietaria de la red profesional LinkedIn, que ha estado presionando fuertemente a los usuarios (y periodistas) para que publiquen cada vez más contenido original en la plataforma.
Sin embargo, Microsoft no comparte datos de LinkedIn con su socio cercano OpenAI, lo que puede explicar los informes de que el creador de ChatGPT estaba en las primeras etapas de la construcción de una red social propia.
El CEO y cofundador de Open AI, Sam Altman, ha estado solicitando comentarios sobre la idea, informó The Verge, y señaló que Altman había insinuado anteriormente que tal proyecto estaba en su mente cuando se informó que Meta lanzaría una aplicación de IA independiente para competir con ChatGPT.
Otras empresas que no tienen una ventaja competitiva en redes sociales se están dando cuenta de que esto las pone en desventaja.
En marzo, Perplexity.ai hizo pública su oferta para comprar TikTok, destacando su valor para una empresa que desarrolla un motor de búsqueda de IA. “Esto proporcionaría a los usuarios respuestas completas y bien citadas que combinan el mejor motor de respuestas del mundo con una de las bibliotecas más grandes de contenido generado por los usuarios”, declaró la empresa.
A principios de este mes, también se informó que Amazon.com Inc. (AMZN) estaba entre los postores, aunque el CEO Andy Jassy se negó a hacer comentarios cuando CNBC le preguntó directamente.
Google, que ha intentado sin éxito impulsar varias redes sociales, tiene menos necesidad de los videos de TikTok porque ya posee YouTube. En su lugar, ha establecido una “colaboración ampliada” con Reddit, la red social para compartir enlaces, lo que le da acceso, según declaró Google en una entrada de blog el año pasado, a “una increíble variedad de conversaciones y experiencias humanas auténticas”.
Se esperan más acuerdos como este: como escribí el mes pasado, Digg, un antiguo competidor de Reddit, está resurgiendo con la evidente intención de crear otro repositorio de interacciones humanas que sea útil para las empresas de inteligencia artificial.
Todas estas medidas reflejan la demanda de datos por parte de las empresas de IA. Esto se produce a expensas de los usuarios que ingresaban información en redes sociales con un propósito y ahora la encuentran utilizada para otro. Discretamente, las empresas han ido modificando sus políticas de privacidad para amparar la legalidad de este cambio.
En la configuración, puedes encontrar maneras ocultas de aislar tus datos para que no se usen para desarrollar IA, aunque probablemente ya sea demasiado tarde. Como Johnny Five, las empresas de IA “¡necesitan información!” La obtendrán como y donde puedan.
Esta nota no refleja necesariamente la opinión del consejo editorial de Bloomberg LP y sus propietarios.
Lea más en Bloomberg.com