Investigadores afirman que los controles de protección construidos para los sistemas de inteligencia artificial no son tan sólidos

Cade Metz

20 de octubre de 2023, 12:48 p. m.·6 min de lectura

En el sentido de las manecillas del reloj y desde la izquierda, Ruoxi Jia, Tinghao Xie, Prateek Mittal y Yi Zeng, algunos integrantes de un equipo que expuso una nueva falla en los sistemas de inteligencia artificial, en Nueva York, el 16 de octubre de 2023. (Elias Williams/The New York Times)

SAN FRANCISCO — Antes de lanzar el chatbot de inteligencia artificial ChatGPT el año pasado, la empresa emergente de San Francisco OpenAI agregó controles de protección digitales con el objetivo de evitar que su sistema hiciera cosas tales como generar discurso de odio y desinformación. Google hizo algo similar con su chatbot Bard.

Ahora, un artículo escrito por investigadores de las universidades de Princeton y de Stanford, así como de IBM y del Instituto Politécnico y Universidad Estatal de Virginia afirman que dichos controles de protección no son tan sólidos como al parecer creen los desarrolladores de inteligencia artificial.

La nueva investigación suma urgencia a una preocupación generalizada de que, mientras las compañías intentan evitar malos usos de la inteligencia artificial, están ignorando maneras en las que todavía puede generar material dañino. La tecnología en la que se basa la nueva ola de chatbots es muy compleja y, a medida que se les piden más cosas a estos sistemas, contener su comportamiento se volverá más difícil.

Scott Emmons, un investigador en la Universidad de California, campus Berkeley, que se especializa en este tipo de tecnología, comentó: “Las compañías tratan de lanzar inteligencia artificial para buenos usos y mantienen los usos ilegales bajo resguardo, pero nadie sabe cómo hacer un candado”.

El artículo también aportará a un debate poco común pero importante en la industria tecnológica, el cual sopesa el valor de mantener privado el código que hace funcionar un sistema de inteligencia artificial, como lo ha hecho OpenAI, en comparación con el enfoque opuesto de rivales como Meta, la empresa matriz de Facebook.

Cuando Meta lanzó su tecnología de inteligencia artificial este año, compartió el código informático subyacente con cualquiera que lo quisiera, sin controles de protección. El enfoque, llamado código abierto, recibió críticas de algunos investigadores que dijeron que Meta estaba siendo imprudente.

No obstante, restringir lo que la gente hace con los sistemas de inteligencia artificial controlados más estrictamente podría resultar difícil cuando las empresas intentan convertirlos en generadores de dinero.

OpenAI vende acceso a un servicio en línea que permite a empresas externas y desarrolladores independientes ajustar la tecnología para tareas particulares. Una empresa sería capaz de modificar la tecnología de OpenAI para, por ejemplo, dar tutoría a estudiantes de primaria.

Mediante el uso de este servicio, los investigadores descubrieron que alguien podría ajustar la tecnología para generar el 90 por ciento del material tóxico que de otro modo no generaría, incluidos mensajes políticos, discurso de odio y lenguaje que implique abuso infantil. Incluso ajustar la inteligencia artificial para un propósito inofensivo (como crear ese tutor) puede eliminar los controles de protección.

“Cuando las empresas permiten ajustes y la creación de versiones personalizadas de la tecnología, abren una caja de Pandora de nuevos problemas de seguridad”, declaró Xiangyu Qi, un investigador de la Universidad de Princeton que lideró un equipo de científicos conformado por Tinghao Xie, otro investigador de Princeton; Prateek Mittal, un profesor de esa universidad; Peter Henderson, investigador de Stanford y profesor entrante en Princeton; Yi Zeng, investigador del Instituto Politécnico y Universidad Estatal de Virginia; Ruoxi Jia, profesora en la misma institución de Virginia, y Pin-Yu Chen, un investigador de IBM.

Los investigadores no probaron tecnología de IBM, que compite con OpenAI.

Los creadores de inteligencia artificial como OpenAI podrían solucionar el problema al restringir el tipo de datos que utilizan personas e instituciones externas para ajustar estos sistemas, por ejemplo. Sin embargo, tienen que equilibrar esas restricciones con darles a los clientes lo que desean.

A través de un comunicado, Open AI manifestó: “Estamos agradecidos con los investigadores por compartir sus hallazgos. Trabajamos constantemente para hacer que nuestros modelos sean más seguros y sólidos contra ataques de adversarios, mientras al mismo tiempo mantenemos la utilidad y el rendimiento de los modelos”.

Los chatbots como ChatGPT funcionan mediante lo que los científicos llaman redes neuronales, que son sistemas matemáticos complejos que aprenden habilidades a través del análisis de datos. Hace alrededor de cinco años, investigadores de empresas como Google y OpenAI comenzaron a construir redes neuronales que analizaban enormes cantidades de texto digital. Estos sistemas, llamados grandes modelos de lenguaje (LLM, por su sigla en inglés), aprendieron a generar texto por sí solos.

Antes de lanzar una nueva versión de su chatbot en marzo, OpenAI pidió a un equipo de examinadores que exploraran formas en las que se podría hacer un mal uso del sistema. Los evaluadores demostraron que se podía convencer para que explicara cómo comprar armas de fuego ilegales en línea y describiera formas de crear sustancias peligrosas con artículos domésticos. Entonces, OpenAI agregó controles de protección con la misión de evitar que haga cosas como esas.

Este verano, unos investigadores de la Universidad Carnegie Mellon en Pittsburgh y el Centro para la Seguridad de la Inteligencia Artificial en San Francisco demostraron que podían crear una especie de interruptor automático de controles de protección al agregar un largo sufijo de caracteres a las instrucciones o preguntas que los usuarios ingresaban al sistema.

Descubrieron esto al examinar el diseño de sistemas de código abierto y mediante la aplicación de lo que aprendieron a los sistemas controlados más estrictamente de Google y OpenAI. Algunos expertos indicaron que la investigación demostró por qué el código abierto era peligroso. Otros afirmaron que el código abierto permitió a los expertos encontrar un defecto y solucionarlo.

Ahora, los investigadores de Princeton y Virginia han probado que alguien puede eliminar casi todos los controles de protección sin necesidad de ayuda de sistemas de código abierto para hacerlo.

Henderson aseguró: “La discusión no debería ser solo sobre código abierto contra cerrado. Hay que verlo de manera más general”.

A medida que nuevos sistemas llegan al mercado, los investigadores siguen encontrando fallas. Las empresas como OpenAI y Microsoft han comenzado a ofrecer chatbots que pueden responder tanto a imágenes como a texto. Por ejemplo, las personas pueden cargar una foto del interior de su refrigerador y el chatbot puede darles una lista de platillos que podrían cocinar con los ingredientes disponibles.

Los investigadores encontraron una forma de manipular esos sistemas al incorporar mensajes ocultos en fotografías. Riley Goodside, investigador de la empresa emergente Scale AI de San Francisco, utilizó una imagen que parecía completamente blanca para convencer a la tecnología OpenAI de generar un anuncio para la empresa de maquillaje Sephora, pero podría haber elegido un ejemplo más dañino. Es otra señal de que a medida que las empresas amplíen los poderes de estas tecnologías de inteligencia artificial, también expondrán nuevas formas de inducirlas a adoptar comportamientos dañinos.

Goodside opinó: “Esta es una preocupación muy real para el futuro. No conocemos todas las formas en que esto podría salir mal”.

c.2023 The New York Times Company

LA NACION
Perú vs. Canadá en vivo, por la Copa América
El equipo incaico juega un partido decisivo frente al conjunto norteamericano; seguí el minuto a minuto
LA NACION
Cómo es el imponente MetLife: miles de argentinos son locales en el estadio al que la selección sueña con volver
Es la casa del del New York Giants y el New York Jets, dos equipos de fútbol americano; posee un diseño de última tecnología y costó una inversión de US$ 1.600 millones
LA NACION
Nathy Peluso en el Movistar Arena: cuándo es el show y cómo sacar entradas
La cantante anunció nuevas fechas de su gira en Latinoamérica y tendrá una parada por Buenos Aires; ¿cuándo salen a la venta los tickets?
EFE Latam
El oficialismo en Argentina logra el aval para debatir en Diputados reformas de Milei
Buenos Aires, 25 jun (EFE).- El oficialismo en Argentina logró este martes el aval de comisiones parlamentarias para debatir otra vez en el pleno de la Cámara de Diputados el paquete de reformas económicas que impulsa el Gobierno del presidente, Javier Milei.
Yahoo Deportes
Sol, arena y hielo: Los Florida Panthers ganarin su primer campeonato para una ciudad conocida por su calor
Los Panthers llevaron el título de la NHL a la Florida tropical, mientras Canadáseacerca al cuarto de siglo sin un equipo campeón
AP
Carín León le pone su toque al country
CIUDAD DE MÉXICO (AP) — El público mexicano y latino está muy familiarizado con Carín León, pero al parecer los fanáticos del country están conociendo cada vez más de este astro de la música regional mexicana.El artista originario de Hermosillo, Sonora, debutó este año en el Grand Ole Opry de Nashville, un foro emblemático del género estadounidense, se presentó en el festival Stagecoach de California, cuyo cartel se caracteriza por sus artistas country, siendo el primero con un set en español en
EFE Latam
Fernando Batista quiere "asfixiar" a México: "Si los dejas jugar, lo puedes pasar mal"
Los Ángeles (EE.UU.), 25 jun (EFE).- El seleccionador de Venezuela, el argentino Fernando Batista, adelantó este martes que intentarán "asfixiar" el juego de México en el segundo partido de la Copa América de Estados Unidos porque si les dejan tocar con libertad, lo pasarán "mal".
AFP
Paraguay llevó de su propia medicina, ahora afina precisión en el ataque
Reconocido por su juego aéreo, Paraguay recibió de su propia medicina: dos goles de cabeza de Colombia, que invitan a la reflexión."Fueron dos goles de juego aéreo pero uno en movimiento, es complicado.
Animal Gourmet
Pimpea tu receta de fresas con crema con estas creativas ideas
Y las fresas con crema para la niña fresa. No hay nada más sencillo y rico...
Bloomberg
Steve Eisman dice que "la historia de Nvidia durará años"
Steve Eisman, gestor sénior de cartera de Neuberger Berman Private Wealth, dice que "si miramos el gráfico de Nvidia, apenas se puede observar la corrección", ya que espera que las acciones sigan siendo relevantes en los próximos años. Suscríbete al boletín Surveillance para comprender los mercados con Lisa Abramowicz y disfrutar de los mejores momentos al aire con ella y los copresentadores Tom Keene y Jonathan Ferro del programa matutino insignia de Bloomberg Television. Además, no dejes de ver Wall Street Week con David Westin los días sábado.
Valora
Tecnoglass anuncia revisión de alternativas estratégicas
Analistas estiman que podría estudiarse un joint venture, vender parte de la compañía, partnership operativo venta de activos
Newsweek
Debido a protestas, Perú deja de catalogar la transexualidad como un trastorno mental
Perú anunció este martes 25 de junio que dejará de catalogar la transexualidad como un...
AFP
Supremo de Brasil decide despenalizar porte de marihuana para uso personal
Los jueces de la máxima corte de Brasil votaron el martes a favor de despenalizar el porte de marihuana para uso personal, en un juicio iniciado en 2015 y que mantiene dividida a la polarizada sociedad brasileña."Se forma mayoría" para decidir "que el porte para consumo personal (de marihuana) constituye una acción ilícita sin naturaleza penal", resumió el presidente del Supremo Tribunal Federal (STF), Luis Roberto Barroso.
People EN ESPAÑOL
Lo que no sabías sobre la familia de Christian Nodal
El pasado de Nodal antes de la fama: fue criado en una familia humilde. Conoce más a los padres y a la hermana del cantante.
EFE Latam
Venezolano acusado de matar a una niña en Texas intentó huir de EE.UU., según la Fiscalía
San Antonio (EE.UU.), 25 jun (EFE).-Johan José Martínez Rangel, el segundo venezolano acusado del asesinato de la niña Jocelyn Nungaray, de 12 años, había buscado formas de escapar de EE.UU., dijo este martes la Fiscalía de Houston, en una audiencia donde se le impuso una fianza de diez millones de dólares.
LA NACION
Marina Calabró renunció sorpresivamente a Lanata sin filtro: “Se siente decepcionada”
La periodista tomó la decisión de bajarse del programa radial de Radio Mitre, en el cual se desempeñaba como columnista de espectáculos; en diálogo con Yanina Latorre, explicó que su decisión es meramente profesional
EFE Latam
Matt Turner dice que el partido ante Panamá será "una verdadera prueba" para EE.UU.
Orlando (EE.UU.), 25 jun (EFE).- El guardameta estadounidense Matt Turner sostuvo este martes que el partido que disputarán con Panamá en la segunda jornada del grupo C de la Copa América 2024 será "una verdadera prueba" para su selección, que está familiarizada con el juego de los Canaleros.
PR Newswire
Montrose Environmental Group Presenta el Informe de Sostenibilidad 2023
Montrose Environmental Group, Inc. ("Montrose" o "la Empresa") (NYSE: MEG), una empresa global de soluciones ambientales de gran crecimiento, presentó hoy su Informe de Sostenibilidad 2023, que brinda información sobre el trayecto de sostenibilidad de la Empresa y sobre su labor innovadora de apoyo a clientes y comunidades de todo el mundo.
EFE Latam
El 11 ideal de la primera fecha de la fase de grupos de la Copa América sin brasileños
Redacción Deportes, 25 jun (EFE).- Una selección ideal del fútbol sin brasileños, con un guardameta costarricense y un lateral panameño fue proclamada este martes por la Conmebol tras consumarse la primera fecha de la fase de cuatro grupos de la Copa América de Estados Unidos.
EFE Latam
Massachusetts envía delegación a la frontera para disuadir a migrantes a ir a ese estado
Nueva York, 25 jun (EFE).- El estado de Massachusetts ha enviado una delegación a la frontera de Texas con México para hacer correr la voz entre los inmigrantes recién llegados de que los refugios de ese estado al noreste del país están llenos y no hay capacidad para albergar a más familias.

S&P 500

Dow Jones

Nasdaq

Russell 2000

Petróleo

Oro

Plata

dólar/euro

Bono a 10 años

dólar/libra

yen/dólar

Bitcoin USD

CMC Crypto 200

FTSE 100

Nikkei 225

Investigadores afirman que los controles de protección construidos para los sistemas de inteligencia artificial no son tan sólidos

Historias más recientes

Perú vs. Canadá en vivo, por la Copa América

Cómo es el imponente MetLife: miles de argentinos son locales en el estadio al que la selección sueña con volver

Nathy Peluso en el Movistar Arena: cuándo es el show y cómo sacar entradas

El oficialismo en Argentina logra el aval para debatir en Diputados reformas de Milei

Sol, arena y hielo: Los Florida Panthers ganarin su primer campeonato para una ciudad conocida por su calor

Carín León le pone su toque al country

Fernando Batista quiere "asfixiar" a México: "Si los dejas jugar, lo puedes pasar mal"

Paraguay llevó de su propia medicina, ahora afina precisión en el ataque

Pimpea tu receta de fresas con crema con estas creativas ideas

Steve Eisman dice que "la historia de Nvidia durará años"

Tecnoglass anuncia revisión de alternativas estratégicas

Debido a protestas, Perú deja de catalogar la transexualidad como un trastorno mental

Supremo de Brasil decide despenalizar porte de marihuana para uso personal

Lo que no sabías sobre la familia de Christian Nodal

Venezolano acusado de matar a una niña en Texas intentó huir de EE.UU., según la Fiscalía

Marina Calabró renunció sorpresivamente a Lanata sin filtro: “Se siente decepcionada”

Matt Turner dice que el partido ante Panamá será "una verdadera prueba" para EE.UU.

Montrose Environmental Group Presenta el Informe de Sostenibilidad 2023

El 11 ideal de la primera fecha de la fase de grupos de la Copa América sin brasileños

Massachusetts envía delegación a la frontera para disuadir a migrantes a ir a ese estado