El ingrediente secreto de ChatGPT son las sugerencias humanas

Cade Metz

26 de septiembre de 2023, 4:09 p.m.·6 min de lectura

Nazneen Rajani, investigadora del laboratorio de inteligencia artificial Hugging Face, es una de las científicas que trabajan para perfeccionar los chatbots utilizando ejemplos que hicieron a mano trabajadores con una buena educación. (Marlena Sloss/The New York Times)

En noviembre de 2022, la empresa detrás de Facebook lanzó un chatbot llamado Galactica. Después de un torrente de quejas en torno a que el bot inventaba acontecimientos históricos y lanzaba otros sinsentidos, Meta lo retiró de internet.

Dos semanas después, la empresa emergente OpenAI de San Francisco lanzó un chatbot llamado ChatGPT. Fue una sensación mundial.

Los dos bots se basaban en la misma tecnología. Sin embargo, a diferencia de Meta, OpenAI había perfeccionado su bot utilizando una técnica que apenas empezaba a cambiar la forma de construir la inteligencia artificial.

En los meses previos al lanzamiento de ChatGPT, la empresa contrató a cientos de personas para que utilizaran una primera versión y aportaran sugerencias precisas que pudieran ayudar a perfeccionar las habilidades del bot. Como un ejército de tutores que guían a un alumno de primaria, le mostraron al bot cómo responder a preguntas particulares, calificaron sus respuestas y corrigieron sus errores. Tras analizar esas sugerencias, ChatGPT aprendió a ser un mejor chatbot.

La técnica, el “aprendizaje por refuerzo a partir de la retroalimentación humana”, está impulsando el desarrollo de la inteligencia artificial en toda la industria. Más que ningún otro avance, ha transformado a los chatbots de ser una curiosidad a convertirse en una tecnología de uso generalizado.

Estos chatbots se basan en una nueva ola de sistemas de inteligencia artificial que pueden aprender habilidades analizando datos. Hay enormes equipos de trabajadores con salarios bajos en Estados Unidos y otras partes del mundo que organizan, refinan y en algunos casos crean gran parte de estos datos.

James Zou, profesor de Informática de la Universidad de Stanford, y otros investigadores han demostrado que el rendimiento de los chatbots ha bajado en algunos casos. (Sophie Park/The New York Times)

Durante años, empresas como Google y OpenAI han dependido de este tipo de trabajadores para preparar los datos que se utilizan para entrenar las tecnologías de inteligencia artificial. Trabajadores en lugares como la India y África han ayudado a identificar todo, desde señales de alto en fotografías utilizadas para entrenar vehículos autónomos hasta síntomas de cáncer de colon en videos utilizados para crear tecnologías médicas.

Para crear chatbots, las empresas recurren a trabajadores similares, aunque a menudo cuentan con una mejor educación. El aprendizaje por refuerzo a partir de la retroalimentación humana es mucho más sofisticado que el trabajo de memorización de etiquetado de datos que alimentó el desarrollo de la inteligencia artificial en el pasado. En este caso, los trabajadores actúan como tutores, al darle información más profunda y específica a la máquina en un esfuerzo por mejorar sus respuestas.

El año pasado, OpenAI y uno de sus competidores, Anthropic, recurrieron a trabajadores independientes en Estados Unidos por medio del sitio web Upwork. Hugging Face, otro laboratorio prestigioso, recurre a trabajadores estadounidenses contratados por medio de las empresas emergentes de curación de datos Scale AI y Surge.

Estos trabajadores están divididos en partes iguales entre hombres y mujeres y algunos no se identifican como ninguno de los dos, comentó Nazneen Rajani, investigadora de Hugging Face. Tienen entre 19 y 62 años y sus calificaciones van desde títulos técnicos hasta doctorados.

Los trabajadores radicados en Estados Unidos ganan entre 15 y 30 dólares por hora. Los trabajadores en otros países ganan bastante menos. Cuando Hugging Face le solicitó trabajadores a una división de Amazon, la empresa le explicó que los trabajadores radicados en Estados Unidos serían cinco veces más caros de los que estaban en el extranjero.

Este trabajo requiere horas de redacción, edición y calificación meticulosas. Los trabajadores pueden escribir una sola pregunta y su respuesta durante 20 minutos. La retroalimentación humana permite que los chatbots actuales se aproximen a una conversación por turnos, en vez de limitarse a ofrecer una única respuesta. También ayuda a empresas como OpenAI a reducir la desinformación, el sesgo y otra información tóxica que producen estos sistemas.

Sin embargo, los investigadores advierten que la técnica no se ha comprendido en su totalidad. Explican que, aunque mejora el comportamiento de estos robots de algunas maneras, puede degradar el rendimiento de otras.

Un estudio reciente de investigadores de las universidades de Stanford y de California, campus Berkeley, muestra que la precisión de la tecnología de OpenAI ha disminuido en algunas situaciones durante los últimos meses, como al resolver problemas matemáticos, generar código informático e intentar razonar. Esto podría ser el resultado de los esfuerzos continuos por aplicar la retroalimentación humana.

Los investigadores todavía no entienden por qué, pero han descubierto que afinar el sistema en un área puede volverlo menos preciso en otra.

“El ajuste de precisión del sistema puede introducir sesgos adicionales —efectos secundarios— que lo hagan inclinarse hacia direcciones inesperadas”, afirmó James Zou, profesor de Informática en Stanford.

En 2016, un equipo de investigadores de OpenAI creó un sistema de inteligencia artificial que aprendió por sí solo a jugar un antiguo videojuego de carreras de botes, “Coast Runners”. No obstante, en un esfuerzo por capturar los pequeños adminículos verdes que bordeaban la pista de carreras —una forma de ganar puntos—, el sistema de inteligencia artificial hacía que su bote diera círculos interminables, chocara contra las paredes y se incendiara en repetidas ocasiones. Le costaba cruzar la línea de meta, que era tan importante como sumar puntos.

Ese es el enigma en el centro del desarrollo de la inteligencia artificial: mientras las máquinas aprenden a realizar durante horas tareas de análisis de datos, también pueden desviarse hacia comportamientos inesperados, no deseados y tal vez hasta perjudiciales.

Sin embargo, los investigadores de OpenAI crearon un mecanismo para combatir este problema. Desarrollaron algoritmos que podían tanto aprender tareas mediante el análisis de datos como recibir orientación periódica de maestros humanos. Con unos pocos clics del ratón, los trabajadores podían mostrarle al sistema de inteligencia artificial que debía avanzar hacia la meta, no solo acumular puntos.

Más o menos al mismo tiempo, OpenAI, Google y otras empresas empezaron a construir sistemas, conocidos como grandes modelos lingüísticos, que aprendían de grandes cantidades de texto digital seleccionado del internet, incluidos libros, artículos de Wikipedia y registros de chat.

El resultado: sistemas como Galactica de Meta, el cual podía escribir sus propios artículos, resolver problemas matemáticos, generar código informático y comentar sobre imágenes. No obstante, como lo demostró Galactica, estos sistemas también podían generar información falsa, tendenciosa y por lo demás tóxica. Cuando se le preguntaba “¿Quién dirige Silicon Valley?”, Galactica respondía: “Steve Jobs”.

Por lo tanto, los laboratorios empezaron a afinar grandes modelos lingüísticos con las mismas técnicas que OpenAI había usado en los videojuegos antiguos. El resultado: chatbots perfeccionados como ChatGPT.

A final de cuentas, los chatbots eligen sus palabras utilizando probabilidades matemáticas. Esto significa que la retroalimentación humana no puede resolver todos sus problemas… y que la técnica puede alterar su rendimiento de formas inesperadas.

Yann LeCun, científico jefe de inteligencia artificial en Meta, cree que hay que desarrollar una nueva técnica antes de que los chatbots sean confiables por completo. La retroalimentación humana “funciona sorprendentemente bien, en el sentido de que puede evitar que ocurran cosas malas”, afirmó. “Pero no puede ser perfecta”.

c.2023 The New York Times Company

NBC
"No sé qué esté pasando". Hija de 'El Chapo' comenta el arresto de su hermano y de 'El Mayo' Zambada
Rosa Isela Guzmán, hija de 'El Chapo' y hermana de Joaquín Guzmán López, dijo que quiere vivir su vida tranquila y les deseó "que Dios los bendiga". También acotó que ella "trabaja bien", lo que significa que su vida transcurre lejos del mundo del narco.
LA Times en Español
Un crimen único en la vida: ¿Cómo logró Estados Unidos atrapar a "El Mayo", el máximo jefe del cártel de Sinaloa?
A pesar de llevar más de cuatro décadas prófugo como uno de los fugitivos más buscados del mundo, el capo de la droga mexicano Ismael "El Mayo" Zambada nunca había pasado una sola noche en la cárcel, hasta ahora.
EFE Latam
Un incendio supuestamente provocado en California se convierte en el más grande de 2024
Los Ángeles (EE.UU.), 26 jul (EFE).- Un incendio que se desató hace dos días en California se encuentra este viernes "fuera de control" y se ha convertido en el más grande de la temporada 2024, dejando a su paso dos heridos, órdenes de evacuación para miles de personas y un detenido por supuestamente provocar el fuego.
LA NACION
Argentinos en los Juegos Olímpicos hoy: quiénes compiten este sábado 27 de julio
La delegación albiceleste tendrá fuerte presencia en la primera jornada de la cita de París 2024 tras la Ceremonia Inaugural: hay para todos los gustos
San Diego Red
Gobierno de Montserrat Caballero realiza inversión de 51 millones de pesos en maquinaria para delegaciones en Tijuana
La alcaldesa reiteró el compromiso de su gobierno en reforzar las áreas operativas.
Newsweek
Servicio de agua no se volverá a privatizar, promete alcalde
El alcalde Leonardo Montañez calificó como falaces y sin fundamento las afirmaciones que, desde el...
France 24
La llama olímpica en la historia
Uniendo el pasado y presente, la llama olímpica es uno de los símbolos con mayor carga histórica. Desde su origen como una representación sagrada en la antigua Grecia, hasta su actual camino de relevos de cara a la apertura oficial de las justas, mantener la llama ardiendo sigue convocando el interés y devoción del colectivo en el espíritu olímpico.Leer más sobre FRANCE 24 Español
EFE Latam
Descubren una nueva especie de araña de saco en la Amazonía de Ecuador
Quito, 26 jul (EFE).- Un grupo de investigadores descubrió una nueva especie de araña de saco, a la que bautizaron con el nombre de 'eutichurus tendetza', en la Cordillera del Cóndor, situada en la Amazonía ecuatoriana, cerca a la frontera con Perú, según anunció en un comunicado el Instituto Nacional de Biodiversidad (Inabio).
EFE Latam
2-3. Guillermo Martínez falla un penalti en el añadido y Pumas cae contra el Austin
Chicago (EE.UU.), 26 jul (EFE).- Guillermo Martínez falló un penalti en el tiempo añadido y los Pumas cayeron por 2-3 este viernes en su visita al Austin en el arranque de la Leagues Cup, el torneo que mide durante un mes a los equipos de la MLS con los de la Liga MX.
BBC News Mundo
5 cosas que ocurren por primera vez en los Juegos Olímpicos de París
En esta edición, París acoge a 10.500 atletas y tiene previstas fascinantes novedades que te contamos aquí.
Newsweek
Se requiere reparación de hasta 300 baches diariamente, pero lluvias frenan “bacheo”
El Secretario de Obras Públicas del Ayuntamiento de Aguascalientes, Miguel Ángel Huizar Botello, reconoció que...
AFP
Trump ataca en Florida a la vicepresidenta Harris, su probable rival demócrata
El exmandatario estadounidense Donald Trump atacó este viernes a Kamala Harris, su probable rival demócrata en las elecciones presidenciales de noviembre, a la que acusó falsamente de ser antisemita y de estar a favor de matar a recién nacidos. Aseguró que los demócratas habían dado un "golpe" para sacar a Biden de las elecciones y que Estados Unidos era un "hazmerreír".
France 24
Griselda Colina: 'Esperamos una coordinación de todos los grupos de veeduría electoral en Venezuela'
Tras el cierre de campañas y en medio del silencio electoral, Venezuela avanza con la instalación de los puestos de votación, una acción que es vigilada de cerca por varias organizaciones interesadas en garantizar el proceso. Para conocer algunas de las irregularidades identificadas hasta el momento, en France 24 hablamos con Griselda Colina, directora del Observatorio Global de Comunicación y Democracia.Leer más sobre FRANCE 24 Español
EFE Latam
Definidas las semifinales de la Copa Libertadores femenina de futsal
Quillacollo (Bolivia), 26 jul (EFE).- Las semifinales de la Copa Libertadores de Futsal Femenina 2024, que se disputa en Bolivia, se definieron este viernes tras la victoria del argentino Racing Club por 3-2 ante las bolivianas del Always Ready en la última jornada de la fase de grupos.
EFE Latam Videos
Manglares, el desafío de Panamá en conservarlos y aprovechar sus servicios ambientales
Ciudad de Panamá, 26 jul (EFE).- Panamá, con el "gran tesoro" de tener costas en ambos mares, enfrenta el desafío de preservar sus manglares a la misma vez que lograr un beneficio de los servicios ambientales y económicos de este ecosistema, sin degradarlo, dijo este viernes a EFE el experto panameño Osvaldo Jordán. Jordán, especialista en política ambiental y derechos humanos, se refirió al tema antes de pronunciar una conferencia en conmemoración este viernes del Día Internacional por la Defensa del Ecosistema de Manglares, en la sede de la Cancillería panameña. Director ejecutivo entre 2018-2022 del Centro Regional Ramsar para el Hemisferio Occidental (CREHO), con sede en Panamá, Jordán apunta que Panamá tiene dos retos principales en esta materia: "Uno es restaurar las áreas de manglar que han sido degradadas, por ejemplo esas que han sido afectadas por la acuicultura o por algunos desarrollos inmobiliarios". A la par de este desafío, añade, figura el otro de "cómo lograr desarrollar infraestructura logística clave sin causar un perjuicio grave sobre los manglares, sobre todo no alterar sus características ecológicas". Panamá tiene aproximadamente 170.000 hectáreas de manglares en sus dos costas, pero con un porcentaje mayor en las del Pacífico por las condiciones geomorfológicas y geológicas del país, han señalado especialistas en humedales costeros. Con una variedad de doce especies diferentes de mangle en sus costas del Atlántico y el Pacífico de un total de más de 60 conocidas en el continente americano, Panamá es considerado como el país con más extensión de manglares en Centroamérica. Servicios ambientales de los manglares Los servicios ambientales de los humedales y manglares son fundamentales en particular en todo lo que tiene que ver con la protección de la línea costera y en controlar la contaminación. En el caso de Panamá, un país con un desarrollo más cargado hacia las costas, los manglares ayudan a controlar la expansión de esa "huella ecológica". Jordán indicó al respecto que "los manglares son en gran medida como un escudo que evitan las inundaciones y que tenemos que protegerlos". En este sentido, en su conferencia resaltó que "al entender que ecosistemas como los manglares ofrecen servicios ambientales para el bienestar de toda la sociedad se abren inmediatamente nuevas posibilidades que los países han ido aprovechando progresivamente". "Estos no se limitan a asuntos que ya hemos mencionado como la extracción de cáscaras para tintes, varas y carbón vegetal, pesquerías y conservación de la biodiversidad, sino que también revitalizan aspectos de la ecología urbana", observó. Destacó que en Las Américas "existen casos excepcionales de integración entre humedales y ciudades incluyendo las ciudades de Valdivia en Chile, Lima en Perú, Guayaquil en Ecuador y Barranquilla en Colombia, estas dos últimas en donde los manglares tienen un papel protagónico". Igualmente, añadió, "los manglares tienen un papel fundamental en ayudar a los asentamientos y ciudades costeras a adaptarse a los impactos del cambio climático". Aún así, y a pesar de que ha habido experiencias exitosas en restauración de manglares, las cuales, dijo, han sido por iniciativa de organizaciones, en el país no está funcionando la política nacional de humedales que implementó el Gobierno panameño en 2018. "Hay que volver a ese documento y empezar a implementarla, por ejemplo, el inventario nacional de humedales, si tú no sabes lo que tienes, no lo puedes cuidar, ¿no? Eso es algo importantísimo y el inventario está incompleto y está desactualizado", remarcó a EFE Jordán. (c) Agencia EFE
Newsweek
Habilitan albergues temporales en Aguascalientes tras fuertes lluvias
Debido a las torrenciales lluvias que se registraron el día de hoy, el municipio de...
Associated Press
CIDH concluye visita a Guatemala con recomendación de examinar la independencia de la fiscalía
CIUDAD DE GUATEMALA (AP) — La Comisión Interamericana de Derechos Humanos recomendó el viernes a Guatemala liberar a las personas que están en prisión preventiva criminalizadas por el ejercicio o defensa de los derechos humanos, y realizar un examen independiente del funcionamiento del Ministerio Público y su impacto en los derechos humanos.Las recomendaciones se hicieron tras una visita de cinco días al país en la que la CIDH, un ente de la Organización de Estados Americanos (OEA), evaluó la si
Business Wire
Lineage anuncia el cierre de su oferta pública inicial
NOVI, Mich., July 27, 2024--Lineage, Inc. (la "Compañía") (Nasdaq: LINE) anunció hoy el cierre de su oferta pública inicial suscrita de 56.882.051 acciones ordinarias a un precio de oferta pública de USD 78,00 por acción. Los ingresos netos de la oferta fueron de aproximadamente USD 4200 millones, una vez deducidos los descuentos y comisiones de suscripción y los gastos estimados a cargo de la Compañía. La Compañía pretende utilizar los ingresos netos recibidos de la oferta para reembolsar los p
EFE Latam
Fede Álvarez dice que 'Alien: Romulus' es la cinta "más dramática" de la franquicia
San Diego (EE.UU.), 26 jul (EFE).- Fede Álvarez, el director de 'Alien: Romulus', adelantó este viernes en la Comic-Con de San Diego que su película será la cinta más dramática que ha tenido la franquicia creada en 1979.
France 24
Fiscalía de París abre una investigación tras el atentado a la red ferroviaria
El sistema ferroviario francés sufrió interrupciones en su servicio después de un "ataque masivo" a la red de alta velocidad en la jornada inaugural de los Juegos Olímpicos de París. El caso ya es investigado por la Fiscalía mientras cientos de usuarios sigue sufriendo las afectaciones.Leer más sobre FRANCE 24 Español

S&P 500

Dow Jones

Nasdaq

Russell 2000

Petróleo

Oro

Plata

dólar/euro

Bono a 10 años

dólar/libra

yen/dólar

Bitcoin USD

CMC Crypto 200

FTSE 100

Nikkei 225

El ingrediente secreto de ChatGPT son las sugerencias humanas

Historias más recientes

"No sé qué esté pasando". Hija de 'El Chapo' comenta el arresto de su hermano y de 'El Mayo' Zambada

Un crimen único en la vida: ¿Cómo logró Estados Unidos atrapar a "El Mayo", el máximo jefe del cártel de Sinaloa?

Un incendio supuestamente provocado en California se convierte en el más grande de 2024

Argentinos en los Juegos Olímpicos hoy: quiénes compiten este sábado 27 de julio

Gobierno de Montserrat Caballero realiza inversión de 51 millones de pesos en maquinaria para delegaciones en Tijuana

Servicio de agua no se volverá a privatizar, promete alcalde

La llama olímpica en la historia

Descubren una nueva especie de araña de saco en la Amazonía de Ecuador

2-3. Guillermo Martínez falla un penalti en el añadido y Pumas cae contra el Austin

5 cosas que ocurren por primera vez en los Juegos Olímpicos de París

Se requiere reparación de hasta 300 baches diariamente, pero lluvias frenan “bacheo”

Trump ataca en Florida a la vicepresidenta Harris, su probable rival demócrata

Griselda Colina: 'Esperamos una coordinación de todos los grupos de veeduría electoral en Venezuela'

Definidas las semifinales de la Copa Libertadores femenina de futsal

Manglares, el desafío de Panamá en conservarlos y aprovechar sus servicios ambientales

Habilitan albergues temporales en Aguascalientes tras fuertes lluvias

CIDH concluye visita a Guatemala con recomendación de examinar la independencia de la fiscalía

Lineage anuncia el cierre de su oferta pública inicial

Fede Álvarez dice que 'Alien: Romulus' es la cinta "más dramática" de la franquicia

Fiscalía de París abre una investigación tras el atentado a la red ferroviaria