Los chatbots podrían estar ‘alucinando’ con más frecuencia de lo que muchos creen

Cade Metz

7 de noviembre de 2023, 3:34 p.m.·6 min de lectura

Simon Hughes, investigador de Vectara, construyó un sistema que tiene como objetivo mostrar con qué frecuencia los chatbots “alucinan”. (Lyndon French/The New York Times).

SAN FRANCISCO — Cuando OpenAI, la empresa emergente de San Francisco, presentó su chatbot en línea ChatGPT a finales del año pasado, millones quedaron cautivados por la forma cuasi humana en que respondía preguntas, escribía poesía y conversaba sobre casi cualquier tema. Pero lo que la mayoría de la gente tardó en darse cuenta es que este nuevo tipo de chatbot a menudo inventa cosas.
‌
Cuando Google presentó un chatbot similar varias semanas después, generó datos sin sentido sobre el telescopio espacial James Webb. Al día siguiente, el nuevo chatbot Bing de Microsoft ofreció todo tipo de información falsa sobre Gap, la vida nocturna mexicana y la cantante Billie Eilish. Luego, en marzo, ChatGPT citó media docena de casos judiciales falsos mientras redactaba un escrito legal de 10 páginas que un abogado presentó ante un juez federal en Manhattan.
‌
Ahora, una nueva empresa emergente llamada Vectara, fundada por exempleados de Google, está tratando de descubrir con qué frecuencia los chatbots se desvían de la verdad. La investigación de la compañía estima que incluso en situaciones diseñadas para evitar que esto suceda, los chatbots inventan información al menos el 3 por ciento de las veces y hasta un 27 por ciento.
‌
Los expertos llaman a este comportamiento de chatbots “alucinación”. Puede que no sea un problema para las personas que juegan con chatbots en sus computadoras personales, pero es un asunto grave para cualquiera que use esta tecnología con documentos judiciales, información médica o datos comerciales confidenciales.
‌
Debido a que estos chatbots pueden responder a casi cualquier solicitud de un número ilimitado de formas, no hay manera de determinar con total certeza la frecuencia con la que alucinan. “Habría que revisar toda la información del mundo”, dijo Simon Hughes, el investigador de Vectara que dirigió el proyecto.
‌
Hughes y su equipo pidieron a estos sistemas que realizaran una tarea única y sencilla que se pudiera verificar fácilmente: resumir artículos de noticias. Incluso en estos casos, los chatbots inventaron información de forma persistente.
‌
“Le proporcionamos al sistema entre 10 y 20 datos y le pedimos un resumen de esos datos”, comentó Amr Awadallah, director ejecutivo de Vectara y exejecutivo de Google. “Que el sistema todavía pueda introducir errores es un problema fundamental”.
‌
Los investigadores sostienen que cuando estos chatbots realizan otras tareas —más allá del mero resumen— las tasas de alucinación pueden ser más altas.
‌
Su investigación también mostró que las tasas de alucinación varían ampliamente entre las principales empresas de IA. Las tecnologías de OpenAI tuvieron la tasa más baja, alrededor del 3 por ciento. Los sistemas de Meta, propietaria de Facebook e Instagram, rondaron el 5 por ciento. El sistema Claude 2 ofrecido por Anthropic, un rival de OpenAI también con sede en San Francisco, superó el 8 por ciento. Un sistema de Google, Palmchat, tuvo la tasa más alta con un 27 por ciento.
‌
Una portavoz de Anthropic, Sally Aldous, declaró: “Hacer que nuestros sistemas sean útiles, honestos e inofensivos, lo que incluye evitar alucinaciones, es uno de nuestros principales objetivos como empresa”.
‌
Google se negó a hacer comentarios y OpenAI y Meta no respondieron de inmediato a las solicitudes de comentarios.

Con esta investigación, Hughes y Awadallah quieren mostrarle a la gente que debe tener cuidado con la información que proviene de los chatbots e incluso del servicio que Vectara vende a las empresas. Muchas compañías ofrecen actualmente este tipo de tecnología para uso empresarial.
‌
Con sede en Palo Alto, California, Vectara es una empresa emergente de 30 personas respaldada por 28,5 millones de dólares en financiación inicial. Uno de sus fundadores, Amin Ahmad, exinvestigador de inteligencia artificial de Google, ha estado trabajando con este tipo de tecnología desde 2017, cuando se incubó dentro de Google y un puñado de otras empresas.
‌
Así como el chatbot de búsqueda Bing de Microsoft puede recuperar información del internet abierto, el servicio de Vectara puede recuperar información de la colección privada de correos electrónicos, documentos y otros archivos de una empresa.
‌
Los investigadores también esperan que sus métodos —los cuales comparten públicamente y seguirán actualizando— ayuden a estimular esfuerzos en toda la industria para reducir las alucinaciones. OpenAI, Google y otros están trabajando para minimizar el problema mediante una variedad de técnicas, aunque no está claro si podrán eliminarlo.

Los chatbots como ChatGPT funcionan con una tecnología llamada grandes modelos de lenguaje (LLM, por su sigla en inglés) que adquiere sus habilidades mediante el análisis de enormes cantidades de texto digital, incluidos libros, artículos de Wikipedia y registros de chat en línea. Al identificar patrones en todos esos datos, un LLM aprende a hacer una cosa en particular: adivinar la siguiente palabra en una secuencia de palabras.
‌
Debido a que el internet está repleto de información falsa, estos sistemas repiten las mismas falsedades. También se basan en probabilidades: ¿cuál es la probabilidad matemática de que la siguiente palabra sea “dramaturgo”? De vez en cuando lo que adivinan es incorrecto.
‌
La nueva investigación de Vectara muestra cómo puede suceder esto. Al resumir artículos de noticias, los chatbots no repiten falsedades de otras partes de internet. Simplemente, se equivocan en el resumen.

Amr Awadallah, director ejecutivo de Vectara, en su oficina en Palo Alto, California, el 31 de octubre de 2023. (Cayce Clifford/The New York Times).

Empresas como OpenAI, Google y Microsoft han desarrollado formas de mejorar la precisión de sus tecnologías. Por ejemplo, OpenAI intenta perfeccionar su tecnología con observaciones de evaluadores humanos, quienes califican las respuestas del chatbot, al separar las respuestas útiles y veraces de las que no lo son. Luego, utilizando una técnica llamada aprendizaje por refuerzo, el sistema pasa semanas analizando las calificaciones para comprender mejor qué es verdadero y qué es ficción.
‌
Sin embargo, los investigadores advierten que las alucinaciones de los chatbots no son un problema fácil de resolver. Debido a que los chatbots aprenden de patrones en los datos y operan con base en probabilidades, se comportan de maneras no deseadas al menos en algunas ocasiones.
‌
Para determinar con qué frecuencia los chatbots alucinaban al resumir artículos de noticias, los investigadores de Vectara utilizaron otro gran modelo de lenguaje para verificar la precisión de cada resumen. Solo así se podía comprobar con eficacia un número tan grande de resúmenes.
‌
Pero James Zou, profesor de Informática de la Universidad de Stanford, dijo que este método conlleva una advertencia. El modelo de lenguaje que realiza la verificación también puede cometer errores.
‌
“El detector de alucinaciones podría ser engañado o alucinar él mismo”, afirmó.

c.2023 The New York Times Company

AFP
El espectáculo del Sena da paso a la competición en París-2024
Tras la majestuosa ceremonia de apertura celebrada en el Sena el viernes, los Juegos de París-2024 meten la directa este sábado con el inicio de la competición en más de una veintena de disciplinas y el reparto de las primeras medallas.Otros deportes que repartirán ya medallas son la esgrima, el judo, los clavados, el skateboarding o el tiro deportivo, donde probablemente se decida el primer campeón olímpico de París-2024.
Euronews
'Del revés 2' se convierte en la película de animación más taquillera de todos los tiempos
'Del revés 2' se ha convertido oficialmente en la película de animación más taquillera de todos los tiempos. Ha superado a 'Frozen II', que ostentaba el récord desde 2019.
LA NACION
Ver París 2024 online: cómo ver los Juegos Olímpicos en vivo
El evento multidisciplinario más importante del mundo quedó inaugurado este viernes 26 de julio, tras la Ceremonia de Apertura; se extiende hasta el domingo 11 de agosto
EFE Latam
Los Premios Eisner de cómic reconocen a cuatro artistas españoles en su 36 edición
San Diego (EE.UU.), 26 jul (EFE).- Los Premios Eisner, considerados los Óscar del cómic, galardonaron este viernes a cuatro artistas españoles durante su edición número 36 que se llevó a cabo en el marco de la Comic-Con de San Diego (California).
Euronews
Donald Trump tacha de "falta de respeto" las declaraciones de Kamala Harris sobre la guerra entre Israel y Hamás
La vicepresidenta Kamala Harris afirmó el jueves que Israel tiene derecho a la autodefensa, pero matizó que "importa cómo lo haga".
AFP
La apertura de los Juegos de París: una apuesta exitosa de Macron
Prometieron un espectáculo "único", un desafío "imposible" hecho realidad, un Sena convertido en escenario de la historia de Francia: el éxito de la ceremonia de inauguración de París-2024 a pesar de la lluvia es también la apuesta triunfante de Emmanuel Macron., celebró Macron en su cuenta de X, donde elogió una "ceremonia grandiosa" y un "momento único y mágico".
LA NACION
Venezuela bloquea un vuelo con expresidentes y denuncian más deportaciones de dirigentes internacionales
Un avión no pudo salir de Ciudad de Panamá por una restricción del espacio aéreo venezolano; impiden ingresar a la delegación del PP español
LA NACION
El increíble regalo francés al mundo: la fiesta de apertura más original y dinámica de la historia de los Juegos Olímpicos
París 2024 quedó formalmente inaugurado después de que un globo aerostático levantara vuelo, simbolizando el pebetero; las delegaciones surcaron el Sena en barcos
hola.com
El espectacular cambio físico de Juan del Val a los 53 años tras dos meses de dieta y ejercicio, ¡con piropazo de Nuria Roca!
El colaborador de 'El Hormiguero' ha compartido una foto en su perfil luciendo tipazo y le han llovido los halagos
LA NACION
El Museo Nacional de Cera de Dublín quiso homenajear a Sinéad O’Connor pero todo terminó de la peor manera
El jueves, la institución dio a conocer con orgullo la réplica de la cantante irlandesa fallecida en 2023, pero ante una oleada imparable de comentarios que cuestionaban el parecido, se vieron oblidados a tomar una drástica decisión
AFP
La sonda Juice se prepara para rebotar entre la Tierra y la Luna rumbo a Júpiter
La sonda espacial Juice se prepara para una maniobra arriesgada y sin precedentes el mes que viene, al utilizar la fuerza gravitacional de la Tierra y la Luna para efectuar un gran salto hacia su meta, el planeta Júpiter.Muchas otras misiones espaciales han utilizado planetas para obtener impulsos gravitacionales, pero esa trayectoria entre la Tierra y la Luna del próximo mes será una "primicia mundial," dijo la ESA. Será la primera vez que una misión utilice un impulso gravitacional doble.
Newsweek
Más de 10 toneladas de basura se acomulan en la Feria Villista
Emiliano González Martines director de Servicios públicos municipal, dio a conocer que ha...
LA NACION
Luto en el fútbol argentino: murió un jugador de 17 años de Mitre de Santiago del Estero
Integraba el plantel de la primera división y la reserva en la liga provincial; el club confirmó la noticia a través de un comunicado en sus redes sociales
San Diego Red
La Casa de los Famosos sorprende con fiesta temática inspirada en Deadpool y Wolverine
Este viernes por la noche, La Casa de los Famosos volvió a sorprender a sus seguidores con una de sus dinámicas más populares.
Associated Press
Edmundo González, inesperado candidato opositor que pretende sacar a Maduro del poder en Venezuela
CARACAS (AP) — Apenas tres meses antes de la fecha prevista para las elecciones de Venezuela, Edmundo González Urrutia recibió una encomienda que jamás buscó: ser el candidato de la principal coalición opositora que pretender sacar a Nicolás Maduro del poder, tras 25 años de gobiernos socialistas.Desde entonces, ha caminado de la mano en actos de campaña en territorio con María Corina Machado, la líder opositora que abanderaba los anhelos de cambios de sus seguidores desde que ganó las primarias
Associated Press
Maduro en tres tiempos: la elección de Venezuela pone a prueba su receta económica y figura de líder
CARACAS (AP) — De ser un personaje secundario con Hugo Chávez al mando de Venezuela, Nicolás Maduro pasó a gobernar el país, en sus propias palabras, con mano de hierro. Su mandato en la última década, que ha contemplado una etapa de flexibilización de la receta económica socialista, se somete el domingo a un examen clave de revalidación en las urnas en unas elecciones en las que enfrenta su principal desafío electoral desde que asumió el poder en el 2013.
hola.com
Planes en la Selva de Irati, declarada nueva Reserva de la Biosfera
La UNESCO ha designado once nuevas reservas en el mundo y este bosque interminable que se reparte entre los valles de Aezkoa y Salazar en su vertiente española, el segundo hayedo más grande de Europa, es una de ellas.
AP
Las perspectivas tras el arresto de "El Mayo": Más violencia en México y más información en EEUU
CIUDAD DE MÉXICO (AP) — Con la detención de Ismael “El Mayo” Zambada, el último de los viejos grandes narcotraficantes mexicanos, comienza una nueva etapa para el Cártel de Sinaloa — uno de los más poderosos del mundo— que los expertos creen puede conllevar a más violencia en México y un considerable flujo de información procedente de los procesos judiciales en cortes estadounidenses.Zambada, quien eludió a las autoridades durante décadas y nunca pisó una cárcel, era uno de los capos más viejos
LA NACION
Polo: Argentina visita a Inglaterra en Windsor con un 10 goles y expone su invicto de 71 años por la Copa Coronación
En el club real Guards, el seleccionado de AAP presentará un equipo de 26 goles de handicap y comenzará ganando por 1-0
LA Times en Español
LAFC inicia con pie derecho la Leagues Cup al golear a los Xolos de Tijuana en el BMO Stadium
El LAFC derrotó a los Xolos de Tijuana el viernes en Los Ángeles en una noche larga para los del nuevo entrenador Juan Carlos Osorio, que fue expulsado del encuentro.

S&P 500

Dow Jones

Nasdaq

Russell 2000

Petróleo

Oro

Plata

dólar/euro

Bono a 10 años

dólar/libra

yen/dólar

Bitcoin USD

CMC Crypto 200

FTSE 100

Nikkei 225

Los chatbots podrían estar ‘alucinando’ con más frecuencia de lo que muchos creen

Historias más recientes

El espectáculo del Sena da paso a la competición en París-2024

'Del revés 2' se convierte en la película de animación más taquillera de todos los tiempos

Ver París 2024 online: cómo ver los Juegos Olímpicos en vivo

Los Premios Eisner de cómic reconocen a cuatro artistas españoles en su 36 edición

Donald Trump tacha de "falta de respeto" las declaraciones de Kamala Harris sobre la guerra entre Israel y Hamás

La apertura de los Juegos de París: una apuesta exitosa de Macron

Venezuela bloquea un vuelo con expresidentes y denuncian más deportaciones de dirigentes internacionales

El increíble regalo francés al mundo: la fiesta de apertura más original y dinámica de la historia de los Juegos Olímpicos

El espectacular cambio físico de Juan del Val a los 53 años tras dos meses de dieta y ejercicio, ¡con piropazo de Nuria Roca!

El Museo Nacional de Cera de Dublín quiso homenajear a Sinéad O’Connor pero todo terminó de la peor manera

La sonda Juice se prepara para rebotar entre la Tierra y la Luna rumbo a Júpiter

Más de 10 toneladas de basura se acomulan en la Feria Villista

Luto en el fútbol argentino: murió un jugador de 17 años de Mitre de Santiago del Estero

La Casa de los Famosos sorprende con fiesta temática inspirada en Deadpool y Wolverine

Edmundo González, inesperado candidato opositor que pretende sacar a Maduro del poder en Venezuela

Maduro en tres tiempos: la elección de Venezuela pone a prueba su receta económica y figura de líder

Planes en la Selva de Irati, declarada nueva Reserva de la Biosfera

Las perspectivas tras el arresto de "El Mayo": Más violencia en México y más información en EEUU

Polo: Argentina visita a Inglaterra en Windsor con un 10 goles y expone su invicto de 71 años por la Copa Coronación

LAFC inicia con pie derecho la Leagues Cup al golear a los Xolos de Tijuana en el BMO Stadium