Los gigantes ahora se pelean por nuestros tweets y comentarios

Ariel Torres

20 de abril de 2023, 4:07 p. m.·5 min de lectura

Las oficinas de Twitter en San Francisco, Estados Unidos

De modo análogo a otras batallas del pasado, pero con reverberaciones mucho más significativas, profundas y eventualmente riesgosas, la nueva confrontación en el frente tecno es por lo que dijimos, hemos dicho y vamos a decir online. Foros, redes sociales, artículos, comentarios, debates, blogs y demás. Cientos de miles de millones de palabras que los modelos de lenguaje emplean, hasta ahora sin cargo, para entrenarse. Esa gratuidad podría llegar pronto a su fin.

En estos días se supo que Reddit, uno de los foros más populares y longevos de Internet, pionera en esto que llamamos redes sociales, empezará a cobrar por darles acceso a su colosal archivo de 18 años de debate y conversación humana a los grandes modelos de lenguaje (LLM; por sus siglas en inglés). Léase, GPT. Ahí tienen, a los que disfrutan de las analogías fáciles: el nuevo petróleo es el discurso público . Un LLM no sirve para nada sin entrenamiento, y el entrenamiento se basa en los textos escritos por humanos hoy disponibles libremente en Internet.

Twitter se propone lo mismo. A Elon Musk, que se quedó afuera de esta nueva fiesta VIP, le parece que los modelos de lenguaje no pueden entrenarse con todo lo que hemos dicho en Twitter sin pagar. Así, Microsoft (el principal inversor de OpenAI, la empresa que creó ChatGPT) y cualquier usuario que emplee un modelo de lenguaje por medio de una API deberán abonar un precio por usar todos estos años de tweets. Según lo que sabemos, Twitter no quiere seguir regalando graciosamente ese monumental acervo de debates, discusiones, ataques verbales, descalificaciones, amenazas, pronunciamientos, discursos e hilos interminables.

(Una API, para los que se están preguntando qué significan estas siglas, es el modo de darle a terceros acceso a ciertas funciones de un software sin abrir el código fuente. Viene de Application Programming Interface y es la forma en que desde 2020 GPT, el modelo de lenguaje de OpenAI, está disponible para otras empresas.)

Wikipedia, uno de los corpus más valiosos para GPT (y otros LLM), de momento no dejó trascender que piense ponerle un coto a sus artículos. No tendría mucho sentido, desde el momento en que es una enciclopedia libre. Con un adicional que le caben a Twitter y a Reddit. ¿Qué ocurriría con los modelos de lenguaje de código fuente abierto? Dolly, por ejemplo. En principio, las licencias compatibles con el software libre contemplan todas estas situaciones, aunque ya sabemos que eso no necesariamente significa que vayan a resolver el conflicto. Conflicto por otro lado paradójico: en plena era de la imagen, el oro está hecho de texto .

Satya Nadella la vio clarísima y en 2019 apostó por OpenAI - Créditos: @GETTY IMAGES

Datito: desde este mes, las compañías ya no podrán poner publicidad en Twitter por medio de Microsoft Advertising, cosa enfureció a Elon, que a su vez ya venía de tener un encontronazo con Apple por el tema de la publicidad. Money, money, money.

Presentación en sociedad de Ernie, el bot de Baidu, motorizado por el modelo de lenguaje Ernie 3.0-Titan

A todo esto, China, que fiscaliza rigurosamente lo que se dice online, se encuentra con un problema tan inesperado como previsible. Debido a los controles, la censura y las penalizaciones, hay mucho menos texto en chino en Internet que en inglés o en español. A pesar de ser la segunda lengua más hablada del mundo, los chinos conversan poco en línea, y por lo tanto Ernie, el LLM de Baidu –algo así como el Google chino–, tiene poco alimento. Cuando decíamos que la censura era una mala idea no estábamos pensando en esto, pero ahí tienen; incluso es perniciosa cuando intentás competir en un terreno tan crítico como la inteligencia artificial. La censura atrasa, si a alguien necesita un título.

De quién es lo que decimos

Independientemente de lo que sostengan los términos y condiciones de cada plataforma, y dejando de lado los regímenes que censuran lo que se dice online, ¿tienen derecho Reddit, Twitter y otras plataformas a lucrar con lo que hemos dicho? Es un área gris, desde el punto de vista legal. Digamos que sí. Pero acá detonan un número de problemas. Si a mediano y largo plazo la IA podría llegar a beneficiarnos a todos, ¿acaso no sería mejor que esos corpus de datos estén disponibles?

Aparece ahí –una vez más en la industria tecno– la concentración. Puesto que entrenar un modelo de lenguaje es costosísimo, las compañías que poseen esta tecnología son muy pocas: Anthropic, Amazon, Google, Meta, OpenAI y ahora la flamante X.AI, de Musk (que hace un par de semanas clamaba que pararan el entrenamiento de los modelos de lenguaje). ¿Le cobrará Twitter también a X.AI? No creo. Twitter como compañía ya no existe, ahora es parte de X Corp, el conglomerado de Musk.

Por lo tanto, si los modelos de lenguaje de software libre encuentran también una barrera en el acceso a los datasets de texto humano, entonces la concentración no hará sino aumentar. Pero nada es tan lineal en momentos disruptivos. Si no se les cobra un centavo a OpenAI, Google, Meta, Amazon y demás, entonces crecerán mucho más rápido y conseguirán la hegemonía mucho antes.

Es una encerrona. No la primera. Ni la última. Pero es más decisiva que las otras, con la sola excepción de la que plantea la defensa de la privacidad, una causa que hoy podemos dar definitivamente por perdida.

En esta encerrona, todo lo que hemos dicho, bien o mal, correcta o incorrectamente razonado, sesgado casi siempre, pero siempre creado por nuestras mentes humanas, y por eso incalculablemente valioso , ¿no debería pertenecerle a esta altura a toda la civilización? No hay una respuesta simple. Ni siquiera GPT pudo responderme este planteo con algo mejor que un “Sí”, “No” y “Es difícil”, todo a la vez. Como niños estadísticos, los modelos de lenguaje devoran lo que dicen los humanos y luego lo emulan. Sin eso, no sirven, no pueden funcionar.

La IA está aquí, y está aquí hace rato. ¿Qué es mejor para las próximas generaciones? ¿Que las compañías que hasta ahora nos sumieron en la alucinación del todo gratis lucren con el discurso público? ¿O, por el contrario, que los modelos de lenguaje, de cualquier pelaje y licencia, puedan alimentarse de ese discurso libremente? La buena noticia es, en todo caso, que, al revés que el petróleo, este es un combustible que no se consume. Aunque el entrenamiento de los LLM contamina. Y mucho.

LA NACION
Yanina Latorre contó todo sobre la separación de Marina Calabró y Rolando Barbano
A tan solo un mes de haber blanqueado su relación, la periodista hizo su pase en El Observador y confirmó su reciente ruptura
hace 5 minutos
LA NACION
Otra función estelar de Lionel Messi: hizo dos goles y dio dos asistencias en el 4-1 de Inter Miami
Los dirigidos por Gerardo Martino comenzaron perdiendo, pero se recuperaron y golearon como visitantes
hace 5 minutos
LA NACION
Hindú extraña jugadores que le faltan, anda mal y sufre el recambio, pero venció a CUBA por ser fiel a su ADN: respetar el juego
El Elefante está lejos del que suele ser, y sin embargo confía en su estrategia, que no es otra que la de siempre y le rindió para una conquista espectacular
hace 7 minutos
EFE Latam
Manifestantes por Gaza piden boicotear la cena de corresponsales de la Casa Blanca
(Actualiza con el número de manifestantes y da más detalles)
hace 24 minutos
LevelUp
El mejor personaje de Animal Crossing se convertirá en LEGO, pero hay malas noticias
Nintendo y LEGO desaprovecharon una gran cualidad del gran Totakeke
hace 26 minutos
Newsweek
Con diversión y una explosión de colores, pequeños celebran su día con “Nuestros Héroes 2024” en la Laguna
Con una explosión de colores y mucha diversión, más de dos mil 500 niños y...
hace 32 minutos
El Nuevo Herald
Los Celtics recuperan en Miami el factor cancha ante un Heat que vueve a sus andadas
Resumen del Juego 3 de playoffs ente el Miami y Boston
hace 36 minutos
iProfesional
Cristina Kirchner aseguró que Javier Milei "no tiene plan de estabilización" y "la gente se caga de hambre"
Cristina Kirchner aseguró que Javier Milei "no tiene plan de estabilización" y "la gente se caga de hambre"
hace 37 minutos
AFP
Kirchner acusa a Milei de someter al pueblo argentino a un "inútil sacrificio"
La expresidenta de Argentina Cristina Kirchner acusó el sábado a Javier Milei de someter al pueblo a un "inútil sacrificio" en pos de un déficit fiscal cero, una afirmación que el actual mandatario respondió responsabilizando al kirchnerismo de dejar "un país destruido"."Escuché al presidente (Milei) en una cadena nacional y me decidí a venir acá para reflexionar sobre este particular momento que vive la Argentina, sobre el proyecto anarcocapitalista y el inútil sacrificio al que está siendo som
hace 39 minutos
LA Times en Español
Luis Miguel conquistó Ontario sin necesidad de ofrecer un gran despliegue vocal
'El Sol de México' impuso su talento en la Toyota Arena de Ontario, aunque su voz no impresionó
hace 39 minutos
Valora
Turbo Restaurante de Rappi ha entregado un millón de órdenes desde su lanzamiento
El 23 % del total de aliados son marcas que han abierto operaciones en la app
hace 42 minutos
Newsweek
Propone Karla Espinoza la creación de un Centro de Reinserción Social Municipal
Como parte de los recorridos que ha estado realizando la candidata de Movimiento Ciudadano a...
hace 44 minutos
EFE Latam
André Villas-Boas se proclama nuevo presidente del Oporto tras 42 años de Pinto da Costa
Lisboa, 27 abr (EFE).- El exentrenador André Villas-Boas se proclamó este sábado vencedor en las elecciones del Oporto para elegir su presidente, destronando al histórico Jorge Nuno Pinto da Costa, que ha estado al frente de los 'dragones' desde hace más de cuatro décadas.
hace 45 minutos
LA NACION
Agenda de TV del domingo: fútbol de Europa, tenis en Madrid, Argentinos vs. Vélez, rugby internacional y la NBA
La Premier League, las ligas de España, Italia y Francia, tenis, básquetbol, motociclismo y automovilismo y más en el menú deportivo en las pantallas y streaming
hace 50 minutos
iProfesional
Dirigentes bonaerenses ironizaron sobre el discurso de Cristina Kirchner: "Otra vez sopa"
Dirigentes bonaerenses ironizaron sobre el discurso de Cristina Kirchner: "Otra vez sopa"
hace 57 minutos
EFE Latam
Torrijos, el expresidente bajo el peso de su apellido que aspira a otro mandato en Panamá
Ciudad de Panamá, 27 abr (EFE).- El expresidente de Panamá Martín Torrijos (2004-2009), hijo del histórico general Omar Torrijos y bajo el peso siempre de ese apellido, se presenta a las elecciones del 5 de mayo con el arriesgado reto de someterse, si es elegido, a una consulta popular superado el ecuador de su mandato para que los panameños decidan si cumplió con sus promesas electorales o si, por el contrario, deberá irse.
hace 59 minutos
LA NACION
Crisis universitaria. Carreras largas, abandono y los “nuevos adolescentes”, entre los desafíos pendientes
La pelea entre el Gobierno y las casas nacionales de estudios superiores, que tuvo su punto cúlmine en la masiva marcha de la semana pasada, abre la puerta para analizar los problemas que aquejan al sector, más allá de la falta de fondos
hace una hora
LA NACION
Quién es la famosa actriz con la que aseguran que Luciano Castro habría empezado un romance
A poco más de dos meses de su separación de Flor Vigna, el actor habría comenzado a salir con la expareja de otro famoso, con quien ya tuvo una historia en el pasado
hace una hora
LA NACION
Top 14, de Francia: Bautista Delguy impulsa su regreso a los Pumas a puro try
El wing es el máximo anotador entre los argentinos en la principal liga del mundo; otras dos conquistas de compatriotas en la jornada del sábado
hace una hora
LevelUp
Tras años de silencio, Kingdom Hearts IV ya tendría ventana de estreno
Square Enix reveló el proyecto con un extenso trailer en 2022
hace una hora

S&P 500

Dow Jones

Nasdaq

Russell 2000

Petróleo

Oro

Plata

dólar/euro

Bono a 10 años

dólar/libra

yen/dólar

Bitcoin USD

CMC Crypto 200

FTSE 100

Nikkei 225

Los gigantes ahora se pelean por nuestros tweets y comentarios

Historias más recientes

Yanina Latorre contó todo sobre la separación de Marina Calabró y Rolando Barbano

Otra función estelar de Lionel Messi: hizo dos goles y dio dos asistencias en el 4-1 de Inter Miami

Hindú extraña jugadores que le faltan, anda mal y sufre el recambio, pero venció a CUBA por ser fiel a su ADN: respetar el juego

Manifestantes por Gaza piden boicotear la cena de corresponsales de la Casa Blanca

El mejor personaje de Animal Crossing se convertirá en LEGO, pero hay malas noticias

Con diversión y una explosión de colores, pequeños celebran su día con “Nuestros Héroes 2024” en la Laguna

Los Celtics recuperan en Miami el factor cancha ante un Heat que vueve a sus andadas

Cristina Kirchner aseguró que Javier Milei "no tiene plan de estabilización" y "la gente se caga de hambre"

Kirchner acusa a Milei de someter al pueblo argentino a un "inútil sacrificio"

Luis Miguel conquistó Ontario sin necesidad de ofrecer un gran despliegue vocal

Turbo Restaurante de Rappi ha entregado un millón de órdenes desde su lanzamiento

Propone Karla Espinoza la creación de un Centro de Reinserción Social Municipal

André Villas-Boas se proclama nuevo presidente del Oporto tras 42 años de Pinto da Costa

Agenda de TV del domingo: fútbol de Europa, tenis en Madrid, Argentinos vs. Vélez, rugby internacional y la NBA

Dirigentes bonaerenses ironizaron sobre el discurso de Cristina Kirchner: "Otra vez sopa"

Torrijos, el expresidente bajo el peso de su apellido que aspira a otro mandato en Panamá

Crisis universitaria. Carreras largas, abandono y los “nuevos adolescentes”, entre los desafíos pendientes

Quién es la famosa actriz con la que aseguran que Luciano Castro habría empezado un romance

Top 14, de Francia: Bautista Delguy impulsa su regreso a los Pumas a puro try

Tras años de silencio, Kingdom Hearts IV ya tendría ventana de estreno