La carrera para evitar ‘el peor escenario posible para el aprendizaje automático’

Issie Lapowsky

26 de junio de 2023, 10:29 a. m.·10 min de lectura

Rebecca Portnoff, directora de ciencia de datos de Thorn, en Pittsburgh, Pensilvania, el 16 de junio de 2023. (Kristian Thacker/The New York Times)

Dave Willner ha asistido en primera fila a la evolución de las peores cosas de internet.

Empezó a trabajar en Facebook en 2008, cuando las empresas de redes sociales inventaban sus normas sobre la marcha. Como responsable de la política de contenidos de la empresa, Willner redactó las primeras normas comunitarias oficiales de Facebook hace más de una década, convirtiendo lo que, según él, era una lista informal de una página que se reducía sobre todo a prohibir a “Hitler y la gente desnuda” en lo que ahora es un voluminoso catálogo de insultos, delitos y otras grotescas cosas que están prohibidas en todas las plataformas de Meta.

Así que el año pasado, cuando el laboratorio de inteligencia artificial OpenAI de San Francisco se disponía a lanzar Dall-E, una herramienta que permite a cualquiera crear al instante una imagen describiéndola con unas pocas palabras, la empresa nombró a Willner responsable de confianza y seguridad. Al principio, eso significaba examinar todas las imágenes y mensajes que los filtros de Dall-E señalaban como posibles infracciones, y encontrar formas de evitar que los posibles infractores tuvieran éxito.

No pasó mucho tiempo antes de que Willner se encontrara ante una amenaza conocida.

Así como los depredadores de menores habían utilizado durante años Facebook y otras grandes plataformas tecnológicas para difundir imágenes de abusos sexuales a menores, ahora intentaban usar Dall-E para crear otras totalmente nuevas. “No me sorprende que la gente intente hacerlo”, afirmó Willner. “Pero para ser muy claros, tampoco le sorprende a la gente de OpenAI”.

A pesar de todo lo que se ha dicho hace poco sobre los hipotéticos riesgos existenciales de la IA generativa, los expertos afirman que es esta amenaza inmediata —los depredadores de menores que ya aprovechan nuevas herramientas de IA— la que merece toda la atención del sector.

Julie Cordua, directora ejecutiva de Thorn, una organización sin fines de lucro que lucha contra la propagación del abuso sexual infantil en Internet, en El Segundo, California, el 21 de junio de 2023. (Stephen Goldstein/The New York Times)

En un artículo publicado recientemente por el Observatorio de Internet de Stanford y Thorn, una organización sin fines de lucro que lucha contra la propagación de los abusos sexuales a menores en internet, los investigadores descubrieron que, desde el pasado mes de agosto, se ha producido un pequeño pero significativo aumento de la cantidad de material fotorrealista de abusos sexuales a menores generado por IA que circula por la red oscura.

Según los investigadores de Thorn, esto se ha manifestado sobre todo en imágenes que utilizan el parecido de víctimas reales pero en poses nuevas, sometidas a nuevas y cada vez más atroces formas de violencia sexual. Según los investigadores, la mayoría de estas imágenes no han sido generadas por Dall-E, sino por herramientas de código abierto desarrolladas y publicadas con escasa protección.

En su artículo, los investigadores informan de que menos del uno por ciento del material de abuso sexual infantil encontrado en una muestra de comunidades depredadoras parecían ser imágenes fotorrealistas generadas por IA. Sin embargo, dado el vertiginoso ritmo de desarrollo de estas herramientas de IA generativa, los investigadores predicen que esa cifra solo aumentará.

“Dentro de un año, vamos a llegar a un estado muy problemático en esta área”, comentó David Thiel, el tecnólogo jefe del Observatorio de Internet de Stanford, que coescribió el documento con la directora de ciencia de datos de Thorn, Rebecca Portnoff, y la jefa de investigación de Thorn, Melissa Stroebel. “Este es absolutamente el peor escenario para el aprendizaje automático que se me ocurre”.

‘Confiamos en la gente’

En 2003, el Congreso aprobó una ley por la que se prohibía la “pornografía infantil generada por computadora”, un caso poco frecuente en el que el Congreso se preparaba para el futuro. Pero en aquel momento, la creación de esas imágenes era exorbitantemente costosa y compleja a nivel tecnológico.

El costo y la complejidad de la creación de esas imágenes no han dejado de disminuir, pero cambiaron el pasado agosto con el debut público de Stable Diffusion, un generador de texto a imagen gratuito y de código abierto desarrollado por Stability AI, una empresa de aprendizaje automático con sede en Londres.

En su primera versión, Stable Diffusion ponía pocos límites al tipo de imágenes que su modelo podía producir, incluyendo las que contenían desnudos. “Confiamos en la gente y en la comunidad”, declaró Emad Mostaque, director ejecutivo de la empresa, a The New York Times el pasado otoño.

Mediante un comunicado, Motez Bishara, director de comunicaciones de Stability AI, afirmó que la empresa prohíbe el uso indebido de su tecnología con fines “ilegales o inmorales”, incluida la creación de material de abuso sexual infantil. “Apoyamos de manera firme los esfuerzos de las fuerzas de seguridad contra quienes hagan un uso indebido de nuestros productos con fines ilegales o nefastos”, señaló Bishara.

Dado que el modelo es de código abierto, los desarrolladores pueden descargar y modificar el código en sus propios ordenadores y utilizarlo para generar, entre otras cosas, pornografía adulta realista. En su artículo, los investigadores de Thorn y del Observatorio de Internet de Stanford descubren que los depredadores han modificado esos modelos para que también sean capaces de crear imágenes sexualmente explícitas de niños. En el informe, los investigadores demuestran una versión inocente de este problema, modificando una imagen de una mujer generada por la IA hasta que parece una imagen de Audrey Hepburn de niña.

Desde entonces, Stability AI ha lanzado filtros que intentan bloquear lo que la empresa denomina “contenido inseguro e inapropiado”. Y las versiones más recientes de la tecnología se construyeron utilizando conjuntos de datos que excluyen el contenido considerado “no adecuado para el lugar de trabajo”. Pero, según Thiel, la gente sigue utilizando el modelo antiguo para producir imágenes que el nuevo prohíbe.

A diferencia de Stable Diffusion, Dall-E no es de código abierto y solo se puede acceder a él a través de la propia interfaz de OpenAI. El modelo también se desarrolló con muchas más salvaguardas para prohibir la creación de imágenes de adultos desnudos, incluso legales. “Las propias modelos tienden a negarse a mantener conversaciones sexuales contigo”, explicó Willner. “Lo hacemos sobre todo por prudencia en torno a algunos de estos temas sexuales más oscuros”.

Preguntas abiertas

Thorn tiene una herramienta llamada Safer, que escanea imágenes en busca de abusos a menores y ayuda a las empresas a denunciarlas al Centro Nacional para Menores Desaparecidos y Explotados, que gestiona un centro de intercambio de información designado a nivel federal sobre material sospechoso de abusos sexuales a menores. OpenAI utiliza Safer para escanear los contenidos que los usuarios suben a la herramienta de edición de Dall-E. Esto es útil para detectar imágenes reales de niños, pero Willner afirma que incluso las herramientas automatizadas más sofisticadas podrían tener problemas para identificar con precisión las imágenes generadas por IA.

Se trata de una preocupación emergente entre los expertos en seguridad infantil: Que la IA no solo se utilice para crear nuevas imágenes de niños reales, sino también para hacer explícitas imágenes de niños que no existen.

Ese contenido es ilegal y habrá que denunciarlo. No obstante, esa posibilidad también ha suscitado la preocupación de que el centro federal de intercambio de información se vea aún más inundado de imágenes falsas que complicarían los esfuerzos por identificar a las víctimas reales. Tan solo el año pasado, la CyberTipline del centro recibió cerca de 32 millones de denuncias.

“Si empezamos a recibir denuncias, ¿podremos saberlo?”, se preguntó Yiota Souras, consejera general del Centro Nacional para Menores Desaparecidos y Explotados. “¿Estarán etiquetadas o podrán diferenciarse de las imágenes de niños reales?”.

Al menos algunas de esas respuestas tendrán que provenir no solo de empresas de IA, como OpenAI y Stability AI, sino también de empresas que gestionan aplicaciones de mensajería o plataformas de redes sociales, como Meta, la principal informadora de la CyberTipline.

El año pasado, más de 27 millones de denuncias procedieron de Facebook, WhatsApp e Instagram. Las empresas tecnológicas ya utilizan un sistema de clasificación, desarrollado por la alianza del sector Tech Coalition, para clasificar el material sospechoso de abuso sexual infantil en función de la edad aparente de la víctima y la naturaleza de los actos representados. Los investigadores de Thorn y Stanford sostienen que estas clasificaciones deberían ampliarse para reflejar también si una imagen ha sido generada por computadora.

En una declaración a The New York Times, la responsable mundial de seguridad de Meta, Antigone Davis, declaró: “Estamos trabajando para ser decididos y basarnos en pruebas en nuestro enfoque de los contenidos generados por IA, como entender cuándo sería más beneficiosa la inclusión de información identificativa y cómo debería transmitirse esa información”. Davis aseguró que la empresa trabajaría con el Centro Nacional para Menores Desaparecidos y Explotados para determinar el mejor camino a seguir.

Más allá de las responsabilidades de las plataformas, los investigadores sostienen que las empresas de IA pueden hacer mucho más. En concreto, podrían entrenar a sus modelos para que no creen imágenes de desnudos infantiles y para que identifiquen de manera clara las imágenes generadas por inteligencia artificial a medida que circulan por internet. Esto supondría introducir en esas imágenes una marca de agua más difícil de eliminar que las que ya han colocado Stability AI u OpenAI.

Mientras los legisladores tratan de regular la IA, los expertos consideran que exigir algún tipo de marca de agua o rastreo de procedencia es clave para luchar no solo contra el material de abusos sexuales a menores, sino también contra la desinformación.

“Solo se es tan bueno como el mínimo común denominador, por eso es necesario un régimen regulador”, afirmó Hany Farid, profesor de análisis forense digital en la Universidad de California, campus Berkeley.

Farid es responsable del desarrollo de PhotoDNA, una herramienta introducida en 2009 por Microsoft, que muchas empresas tecnológicas utilizan ahora para encontrar y bloquear automáticamente imágenes conocidas de abusos sexuales a menores. Farid afirma que los gigantes tecnológicos tardaron demasiado en utilizar esta tecnología tras su desarrollo, lo que permitió que la lacra del material de abusos sexuales a menores siguiera supurando abiertamente durante años. Farid está trabajando con varias empresas tecnológicas para crear una nueva norma técnica que permita rastrear las imágenes generadas por IA. Stability AI se encuentra entre las empresas que tienen previsto seguir esta norma.

Otra cuestión pendiente es cómo tratará el sistema judicial los casos presentados contra creadores de material de abuso sexual infantil generado por IA, y qué responsabilidad tendrán las empresas de IA. Aunque la ley contra la “pornografía infantil generada por computadora” existe desde hace dos décadas, nunca se ha puesto a prueba en los tribunales. Una ley anterior que intentaba prohibir lo que entonces se denominaba pornografía infantil virtual fue anulada por el Tribunal Supremo en 2002 por atentar contra la libertad de expresión.

Miembros de la Comisión Europea, la Casa Blanca y el Comité Judicial del Senado de Estados Unidos han sido informados de las conclusiones de Stanford y Thorn. Según Thiel, es fundamental que las empresas y los legisladores encuentren respuestas a estas preguntas antes de que la tecnología avance aún más e incluya elementos como el video en movimiento. “Tenemos que lograrlo antes de eso”, concluyó Thiel.

c.2023 The New York Times Company

hola.com
Del reencuentro con Leonor al orgullo de doña Letizia: los mejores momentos del rey Felipe jurando bandera 40 años después
La Academia General Militar de Zaragoza ha acogido este sábado el reencuentro de los reyes Felipe y Letizia con su hija mayor, con la que los vimos por última vez durante los días de Semana Santa, vacaciones de las que también disfrutaron con la infanta Sofía. La princesa de Asturias ha estado presente en el acto conmemorativo del 40º aniversario de la jura de bandera de la promoción a la que pertenece el jefe del Estado. El monarca, ataviado con el uniforme de diario de capital general del Ejér
EFE Latam
El estadounidense Brooks Koepka se proclama vencedor en Singapur
Redacción deportes, 5 may (EFE).- El estadounidense Brooks Koepka se coronó como campeón del LIV Golf Singapur con un total de 198 golpes (-15), después de empezar la última jornada en lo más alto de la clasificación y mantenerse allí hasta el final con 68 impactos (-3) en su último recorrido.
Kameraone
Un border collie celoso no deja que una mujer toque a su dueño
Un border collie de Palermo (Italia) hizo gala de sus instintos protectores: una mujer intentó acariciar la mano de su novio... y al amigo de cuatro patas no le hizo ninguna gracia.
EFE Latam
El italiano Daniele Orsato arbitrará el PSG-Dortmund
Madrid, 5 may (EFE).- El árbitro italiano Daniele Orsato dirigirá el próximo martes el partido de vuelta de las semifinales de la Liga de Campeones PSG-Dortmund en el Parque de los Príncipes de París (21.00h), al que el equipo alemán llega con la ventaja del 1-0 logrado en la ida.
iProUp
Programación para todos y todas: cómo es el proyecto para crear "Escuelas 4.0" en todo el país
Programación para todos y todas: cómo es el proyecto para crear "Escuelas 4.0" en todo el país
iProUp
Cada día costará más distinguir al humano del robot, y lo nuevo de Apple da pista de lo que viene
Cada día costará más distinguir al humano del robot, y lo nuevo de Apple da pista de lo que viene
iProUp
¿Qué va a pasar con Bitcoin?: lo que nunca había sucedido y la expectativa del nuevo máximo
¿Qué va a pasar con Bitcoin?: lo que nunca había sucedido y la expectativa del nuevo máximo
Valora
Mujeres colombianas gestionaron inversión de más de US$1,5 millones en proyectos de triple impacto
Indeleble Social ha promovido la implementación de estrategias de desarrollo de capacidades orientadas a la sostenibilidad.
EFE Latam
El Girona de Míchel, de Segunda División a la Liga de Campeones en 685 días
Girona, 5 may (EFE).- El Girona, inmerso en el mejor año de su nonagenaria historia bajo la batuta de Míchel Sánchez, selló la clasificación para la Liga de Campeones este sábado con una inolvidable victoria contra el Barcelona (4-2) solo 685 días después de su último partido en Segunda División, el día 19 de junio de 2022.
EFE Latam
Zelenski en Pascua ortodoxa: "Dios lleva un galón con la bandera ucraniana en el hombro"
Kiev, 5 may (EFE).- El presidente ucraniano, Volodímir Zelenski, se dirigió este domingo en un vídeomensaje grabado en la Catedral de Santa Sofía de Kiev con motivo de la Pascua ortodoxa y afirmó que con la ayuda de Dios, que "lleva un galón con la bandera ucraniana en el hombro", los ucranianos volverán a vivir en paz.
Euronews
Los israelíes se manifiestan para exigir el alto el fuego en Gaza y la renuncia del primer ministro Netanyahu
El pueblo de Israel habla y se separa de las acciones de su Gobierno: "Esperamos que el mundo nos escuche y sepa que el pueblo de Israel no es el gobierno de Israel"
CNN Espanol
Las verduras no existen: pero esta es la razón por la cual deberías comerlas de todos modos
Si bien el término fruta se reconoce botánicamente como cualquier cosa que contenga una semilla o semillas, verdura es en realidad un término amplio que abarca muchos tipos de plantas comestibles.
CNN Espanol
Kenan Thompson apoya las protestas universitarias siempre que no involucren a su hija en 'SNL'
“ Saturday Night Live ” asumió una de las noticias más importantes de la semana pasada en su último episodio, cuando los miembros del elenco interpretaron a padres preocupados de estudiantes universitarios de la ciudad de Nueva York involucrados en protestas al aire libre durante el fin de semana.
Valora
El gigante portafolio de marcas de Nutresa que ya controla Jaime Gilinski
El Grupo Gilinski toma el control de Nutresa y las más de 62 marcas que posee la icónica empresa de alimentos antioqueña.
Euronews
El Real Madrid sigue batiendo récords, 36 veces campeón de LaLiga
Las cuentas salieron a la perfección para el Real Madrid. Su victoria ante el Cádiz en el Santiago Bernabéu (3-0) y la derrota del FC Barcelona contra el Girona han facilitado que el Real Madrid se proclame matemáticamente campeón de LaLiga.
Euronews
Las fuerzas rusas ejecutan a soldados ucranianos que se rinden, según Human Rights Watch
El informe de Human Rights Watch comenta que los soldados ucranianos fueron "asesinados a sangre fría".
RFI
Durante 80 días, la llama olímpica recorrerá Francia antes de iluminar los Juegos
Tras desembarcar en Marsella procedente de Olimpia (en Grecia) este miércoles 8 de mayo, la llama olímpica recorrerá la geografía francesa, incluidos los territorios de ultramar, durante 80 días hasta llegar a París para la ceremonia de inauguración de los Juegos, el 26 de julio. Estas son las principales etapas del periplo francés de la llama olímpica: . Llegada por mar a Marsella El velero Belem, construido en 1896, partió del puerto de Atenas con el fuego olímpico y llegará a Marsella el 8 de
Euronews
Gran hambruna en el norte de Gaza, a la espera del resultado de las conversaciones en El Cair
Se esperan nuevas conversaciones en Egipto entre Hamás e Israel para llegar a un acuerdo sobre la liberación de los rehenes y un alto el fuego. El Programa Mundial de Alimentos da la voz de alarma sobre la escasez de alimentos en el norte de la Franja.
RFI
El fuego olímpico llega a Marsella a menos de tres meses del inicio de los JJ OO
Tras doce días de navegación a bordo del velero Belem, el fuego olímpico llegará el miércoles a Marsella, donde será recibido por 150.000 personas, en el marco de un dispositivo de seguridad excepcional, a menos de tres meses del comienzo de los Juegos de París. Será la primera ocasión que la llama llegue a Francia para unos Juegos de verano, ya que si bien París albergó las ediciones de 1900 y 1924, el ritual del fuego olímpico no se instauró hasta 1928, en los Juegos de Ámsterdam. Su último pa
Valora
Cereales de Barbie y Hot Wheels llegan a Colombia de la mano de Kellogg’s y Mattel
Kellogg's y Mattel presentaron su nueva propuesta de cereales inspirados en Hot Wheels y Barbie para los consumidores colombianos.

S&P 500

Dow Jones

Nasdaq

Russell 2000

Petróleo

Oro

Plata

dólar/euro

Bono a 10 años

dólar/libra

yen/dólar

Bitcoin USD

CMC Crypto 200

FTSE 100

Nikkei 225

La carrera para evitar ‘el peor escenario posible para el aprendizaje automático’

Historias más recientes

Del reencuentro con Leonor al orgullo de doña Letizia: los mejores momentos del rey Felipe jurando bandera 40 años después

El estadounidense Brooks Koepka se proclama vencedor en Singapur

Un border collie celoso no deja que una mujer toque a su dueño

El italiano Daniele Orsato arbitrará el PSG-Dortmund

Programación para todos y todas: cómo es el proyecto para crear "Escuelas 4.0" en todo el país

Cada día costará más distinguir al humano del robot, y lo nuevo de Apple da pista de lo que viene

¿Qué va a pasar con Bitcoin?: lo que nunca había sucedido y la expectativa del nuevo máximo

Mujeres colombianas gestionaron inversión de más de US$1,5 millones en proyectos de triple impacto

El Girona de Míchel, de Segunda División a la Liga de Campeones en 685 días

Zelenski en Pascua ortodoxa: "Dios lleva un galón con la bandera ucraniana en el hombro"

Los israelíes se manifiestan para exigir el alto el fuego en Gaza y la renuncia del primer ministro Netanyahu

Las verduras no existen: pero esta es la razón por la cual deberías comerlas de todos modos

Kenan Thompson apoya las protestas universitarias siempre que no involucren a su hija en 'SNL'

El gigante portafolio de marcas de Nutresa que ya controla Jaime Gilinski

El Real Madrid sigue batiendo récords, 36 veces campeón de LaLiga

Las fuerzas rusas ejecutan a soldados ucranianos que se rinden, según Human Rights Watch

Durante 80 días, la llama olímpica recorrerá Francia antes de iluminar los Juegos

Gran hambruna en el norte de Gaza, a la espera del resultado de las conversaciones en El Cair

El fuego olímpico llega a Marsella a menos de tres meses del inicio de los JJ OO

Cereales de Barbie y Hot Wheels llegan a Colombia de la mano de Kellogg’s y Mattel