El secreto de la rentabilidad de la IA es contratar a muchas más personas especializadas

Existen modelos de IA que están haciendo algo más que simplemente reducir costes o mejorar la eficiencia, son una mejor y más especializada tecnología que puede salvar vidas

Desde la detección de malas hierbas en los campos de algodón hasta el escaneo de la maleza en busca de señales de cazadores furtivos, las empresas emergentes de IA están contratando toda clase de expertos.
Por Saritha Rai
14 de diciembre, 2024 | 11:39 AM
Últimas cotizaciones

Bloomberg — En el pequeño reino de Bután, docenas de expertos en datos afinan sus modelos de IA desde unas oficinas rodeadas por las majestuosas cimas del Himalaya.

Los trabajadores de iMerit no están allí para entrenar a la inteligencia artificial en tareas básicas como el reconocimiento de una imagen con un “felino marrón en la repisa de la ventana”, sino más bien para enseñar a los algoritmos la anatomía del ojo humano o a detectar cambios en mapas de objetos, eventos y lugares.

Oficina de iMerit en Thimphu, Bután, en octubre.Fotógrafo: Saritha Rai/Bloomberg

Respaldada por tres multimillonarios de Silicon Valley, iMerit pertenece a una creciente cohorte de compañías que construyen una versión más sofisticada, monetizable y fiable de la inteligencia artificial, un sector que va camino de añadir casi US$20 billones a la economía global de aquí a 2030.

PUBLICIDAD

Lea más: Cómo Oracle está atrayendo a startups de Latam como clientes en la nueva era de la IA

Conforme los modelos se hacen más inteligentes, las grandes corporaciones buscan aprovechar al máximo su potencia para tareas altamente especializadas, dando lugar a docenas de startups de servicios de datos dedicados a personalizar las aplicaciones en sectores como las finanzas, la sanidad y la defensa.

Es mucho lo que está en juego.

PUBLICIDAD

A pesar de que el fervor por la IA ha invadido Silicon Valley, continúan las dudas sobre si esta tecnología será lo suficientemente práctica como para que las compañías de todo el mundo paguen por ella y se garantice que los desarrolladores de modelos de IA puedan obtener beneficios.

Evidentemente, Nvidia Corp. (NVDA) se ha erigido en la empresa más valiosa del mundo gracias a la venta de chips de IA. Pero los grandes clientes de la empresa, como Microsoft Corp. (MSFT) y Alphabet Inc. (GOOGL) no dejan de perder dinero por el inmenso coste de construir sistemas de inteligencia artificial más avanzados.

Radha Basu, fundadora y CEO de iMerit, trazó un paralelismo con los programadores informáticos que crearon el internet, los teléfonos celulares y otras plataformas tecnológicas modernas.

“Nosotros somos los codificadores equivalentes a la revolución de la inteligencia artificial”, explicó esta empresaria de pelo canoso, que se prepara para recaudar su próxima ronda de financiación.

Conseguir que la IA alcance una competencia avanzada en sectores no relacionados, sensibles y a veces peligrosos no será fácil. La empresa requiere un profundo banco de expertos humanos dispuestos a añadir a sus trabajos cotidianos la formación y la mejora de modelos en campos técnicos.

En Kenia, una startup está desarrollando tecnología para escanear la maleza en busca de señales de cazadores furtivos. En Kazajstán, expertos médicos están enseñando a utilizar modelos para identificar las primeras fases del cáncer de pulmón. En India, Corea, Vietnam y otros lugares, lingüistas que ganan US$65 la hora están ayudando a las modelos a dominar idiomas distintos del inglés.

En iMerit, que emplea a 5.000 personas en Bután, India y Nueva Orleans, Yeshi Wangmo, de 23 años y procedente de una familia de agricultores, lleva años dominando una única tarea: identificar correctamente las malas hierbas y los residuos en imágenes de vastos campos de maíz y algodón.

Lea más: La startup de IA por voz de un exinvestigador de OpenAI se valora en US$200 millones

PUBLICIDAD

Wangmo y sus colegas, ataviados con coloridas telas bhutanesas de gho y kira, ayudan a empresas como Blue River Technology, filial de Deere & Co (DE), a construir algoritmos que mejoran la precisión en la pulverización de pesticidas y fertilizantes, reduciendo su uso hasta en un 90%.

“Estamos viendo cómo las empresas abordan problemas más avanzados, pero también cada vez más especializados”, afirma Ivan Lee, fundador y CEO de la empresa de soluciones de etiquetado de datos Datasaur Inc, entre cuyos clientes se encuentran Netflix Inc. (NFLX) y el FBI. “Los clientes pueden necesitar dentistas que crecieron en Tanzania o arquitectos de Francia”, dijo Lee, cuyos equipos trabajan principalmente desde Indonesia.

La precisión de los datos es el eje de su trabajo. Cuando se lanzó ChatGPT hace dos años, los críticos se apresuraron a señalar los defectos y fallos de la plataforma. Desde entonces, se han contratado decenas de expertos humanos para el control de calidad. El trabajo es minucioso.

Etiquetadores de datos como Wangmo examinan minuciosamente escáneres, fotos, vídeos y textos para preparar modelos de IA. El objetivo es mejorar los sistemas generativos de IA que se entrenan en vastos conjuntos de datos para analizar o crear nuevos contenidos. Perfeccionarlos elimina la discrepancia entre las capacidades potenciales de la IA y su rendimiento real en el mundo real.

PUBLICIDAD
Yeshi Wangmo ha pasado años dominando la correcta identificación de malas hierbas y residuos en imágenes de vastos campos de maíz y algodón.Fotógrafo: Saritha Rai/Bloomberg

Este tipo de especialización es cada vez más clave en sectores de alto riesgo como los que se ocupan de la inteligencia militar, según Kathleen Walch, directora y gerente general de la empresa de investigación PMI Cognilytica.

Lea más: La IA generativa amenaza a los ingresos de los artistas y será un mercado millonario

PUBLICIDAD

Las versiones de menor nivel de este trabajo no son nuevas.

La industria de los servicios de datos comenzó hace unas dos décadas. Por aquel entonces, los etiquetadores que vivían en lugares como Filipinas y la India se dedicaban principalmente a etiquetar pequeños conjuntos de datos que servían de base, por ejemplo, al reconocimiento de voz para los asistentes de voz o a los motores de búsqueda de los sitios web de compras.

A los críticos les preocupa que la IA haya creado una subclase explotable, señalando los salarios que rondan unos pocos dólares al día en algunos bolsillos de la industria.

PUBLICIDAD

Pero con el paso de los años, a medida que la IA ha ido mejorando, gran parte de las tareas más sencillas ya están automatizadas. La demanda se ha desplazado hacia la contratación de especialistas y el pago de salarios y tarifas más elevados, aunque siguen siendo considerablemente más bajos que los paquetes de compensación para los científicos de datos en Silicon Valley.

En la India, un radiólogo que entrene modelos de IA podría ganar una paga de 100.000 rupias (US$1.200) por unas horas de trabajo, dijo Hardik Dave, fundador y director ejecutivo de Indika AI, una popular empresa de etiquetado de datos. El contratista medio gana aproximadamente un tercio de esa cantidad al mes, dijo.

Hoy en día, las startups que venden servicios de etiquetado atraen a inversores de primera fila.

Este verano, el mayor actor, Scale AI, recaudó dinero de Meta Platforms Inc. (META) y Amazon.com Inc. (AMZN). Con una valoración de casi US$14.000 millones, la empresa ha superado las cifras de destacados creadores de modelos de IA como Mistral y Cohere.

En 2023, la lista de Sequoia de las 50 principales empresas de IA incluía cuatro startups de etiquetado, frente a una sola el año anterior. Una de ellas, Labelbox, está respaldada por Andreessen Horowitz y Kleiner Perkins. Otra, Snorkel AI, está financiada por el brazo de riesgo de Alphabet Inc. con una valoración de US$1.000 millones.

Alex Wang, cofundador de Scale AI, a la izquierda, en la Conferencia Sun Valley de Allen & Co. en julio. Scale AI recaudó dinero de Meta Inc. y Amazon.com Inc.Fotógrafo: David Paul Morris/Bloomberg

En términos más generales, se prevé que el mercado de los etiquetadores de datos, valorado en casi US$20.000 millones en 2024, crezca en torno a un 20% anual hasta 2030, según Grand View Research, una empresa de investigación de mercados con sede en San Francisco.

Lea más: OpenAI, Meta y Orange entrenarán modelos de IA en lenguas africanas

Las consecuencias de un paso en falso también son más graves.

Un marco mal etiquetado podría costar a una empresa millones de dólares, invitar a demandas judiciales o incluso provocar la muerte. Las herramientas de IA para la detección del cáncer o los coches autoconducidos son dos ámbitos delicados.

“Una IA menos precisa puede descarrilar”, afirma Wendy González, CEO de Sama, con sede en Los Gatos, entre cuyos clientes se encuentran Ford Motor Co. (F) y Walmart Inc. (WMT) “Las empresas no pueden permitirse eso”.

Consideremos la unión entre el Hospital General de Massachusetts y Centaur Labs, una startup de etiquetado de datos con 50.000 trabajadores autónomos con sede en países como EE.UU., Kazajstán y Vietnam.

En los últimos años, Centaur Labs, con sede en Boston, ha mejorado los productos utilizados en el hospital, incorporando gradualmente expertos en datos más cualificados. Algunos están relacionados con dolencias cotidianas. (La startup está trabajando en un algoritmo de detección de ronquidos y en una aplicación para la apnea del sueño).

Otras se desvían hacia temas más pesados, como el desarrollo de una IA que pueda identificar con mayor precisión los nódulos pulmonares en las tomografías computarizadas. El mes pasado, la startup anunció una inyección de capital de Accel, Y Combinator y otros.

Polina Pilius, radióloga de Kazajstán que supervisa los equipos de un contratista de Centaur Labs, dijo que el trabajo se va estrechando. Hoy en día, dijo, no basta con detectar nódulos pulmonares. Los clientes quieren cada vez más funciones especializadas que reduzcan el número de falsos positivos y rastreen el crecimiento de los nódulos a lo largo del tiempo. Reducir el riesgo sin recortar gastos es el punto dulce.

"La anotación de datos médicos es un proceso complejo que no tolera las prisas, la incompetencia, la falta de atención o el recorte excesivo de gastos", afirma Pilius.

A pesar de todo lo que puede salir mal, los defensores de la IA sostienen que entrenar modelos para abordar cuestiones complejas en sectores de riesgo es preferible a no hacer nada. En muchos casos, sólo hay ventajas, afirman.

Labelbox, la startup con sede en San Francisco, trabaja con un cliente que vende análisis de cámaras de aparcamiento a empresas que supervisan cientos de miles de camiones. En el último año, los especialistas en datos de Labelbox han entrenado a robots de inteligencia artificial para que sean aún más expertos en vigilar si un conductor está somnoliento o ebrio. Una vez detectado, se alerta a los operadores de la flota y se contacta con el conductor.

Manu Sharma, CEO de Labelbox, dijo que éste es sólo un ejemplo en el que los modelos están haciendo algo más que simplemente reducir costes o mejorar la eficiencia. La mejor tecnología salva vidas, dijo, y los etiquetadores de datos están en primera línea en el avance de las capacidades de la IA.

Están "creando un mundo en el que su experiencia es más accesible y puede aplicarse en beneficio de la sociedad", afirmó.

Lea más en Bloomberg.com