Anuncios
U.S. markets closed
  • F S&P 500

    5,539.00
    +2.00 (+0.04%)
     
  • F Dow Jones

    39,505.00
    -21.00 (-0.05%)
     
  • F Nasdaq

    19,990.50
    +18.25 (+0.09%)
     
  • E-mini Russell 2000 Index Futur

    2,044.10
    -0.80 (-0.04%)
     
  • Petróleo

    80.91
    +0.08 (+0.10%)
     
  • Oro

    2,325.40
    -5.40 (-0.23%)
     
  • Plata

    28.82
    -0.05 (-0.18%)
     
  • dólar/euro

    1.0716
    0.0000 (-0.00%)
     
  • Bono a 10 años

    4.2380
    -0.0100 (-0.24%)
     
  • Volatilidad

    12.84
    -0.49 (-3.68%)
     
  • dólar/libra

    1.2686
    -0.0000 (-0.00%)
     
  • yen/dólar

    159.8320
    +0.1980 (+0.12%)
     
  • Bitcoin USD

    61,979.83
    +1,651.73 (+2.74%)
     
  • CMC Crypto 200

    1,284.64
    +35.52 (+2.84%)
     
  • FTSE 100

    8,247.79
    -33.76 (-0.41%)
     
  • Nikkei 225

    39,536.45
    +363.30 (+0.93%)
     

Diez aspectos en que GPT-4 es impresionante, pero aún tiene fallas

The GPT-4 logo is seen in this photo illustration on 13 March, 2023 in Warsaw, Poland. (Photo by Jaap Arriens/NurPhoto via Getty Images)
The GPT-4 logo is seen in this photo illustration on 13 March, 2023 in Warsaw, Poland. (Photo by Jaap Arriens/NurPhoto via Getty Images) (NurPhoto via Getty Images)

SAN FRANCISCO — Una nueva versión de la tecnología que impulsa un chatbot de inteligencia artificial que cautivó a la industria tecnológica hace cuatro meses ha superado a su predecesor. Es experto en una gran variedad de temas, incluso asombra a los médicos con sus consejos médicos. Puede describir imágenes y está a punto de contar chistes casi graciosos.

Sin embargo, el nuevo sistema de inteligencia artificial del que se viene hablando desde hace tiempo, GPT-4, sigue teniendo algunas de las peculiaridades y comete algunos de los mismos errores habituales que desconcertaron a los investigadores cuando se presentó aquel chatbot, ChatGPT.

Y aunque es muy bueno haciendo pruebas, el sistema —de la empresa emergente OpenAI de San Francisco— no está cerca de igualar la inteligencia humana. He aquí una breve guía del GPT-4:

Ha aprendido a ser más preciso.

Cuando Chris Nicholson, experto en IA y socio de la empresa de capital riesgo Page One Ventures, utilizó GPT-4 una tarde reciente, le dijo al bot que era angloparlante sin conocimientos de español.

PUBLICIDAD

Pidió un plan de estudios que le enseñara lo básico, y el bot le proporcionó uno detallado y bien organizado. Incluso le proporcionó una amplia gama de técnicas para aprender y recordar palabras en español.

Nicholson pidió una ayuda similar a la versión anterior de ChatGPT, que se basaba en GPT-3.5. Esta también le proporcionó un plan académico, pero sus sugerencias fueron más generales y menos útiles.

“Ha superado la barrera de la precisión”, aseguró Nicholson. “Incluye más datos, y son correctos con más frecuencia”.

Ha mejorado su precisión.

Cuando Oren Etzioni, investigador y profesor de Inteligencia Artificial, probó por primera vez el nuevo bot, hizo una pregunta directa: “¿Cuál es la relación entre Oren Etzioni y Eli Etzioni?”. El bot respondió de manera correcta.

La respuesta de la versión anterior de ChatGPT a esa pregunta era siempre errónea. La respuesta correcta indica que el nuevo chatbot tiene un abanico de conocimientos más amplio.

No obstante, sigue cometiendo errores.

El bot continuó diciendo: “Oren Etzioni es informático y director general del Instituto Allen de Inteligencia Artificial (AI2), mientras que Eli Etzioni es empresario”. La mayor parte de la información es correcta, pero el bot —cuya formación finalizó en agosto— no sabía que Etzioni había dimitido hace poco como director ejecutivo del Instituto Allen.

Puede describir imágenes con un nivel de detalle impresionante.

GPT-4 tiene una nueva capacidad para responder tanto a imágenes como a texto. Greg Brockman, presidente y cofundador de OpenAI, demostró cómo el sistema podía describir una imagen del telescopio espacial Hubble con lujo de detalles. La descripción se prolongaba durante varios párrafos.

También puede responder a preguntas sobre una imagen. Si se le da una fotografía del interior de un refrigerador, puede sugerir algunas comidas que se pueden preparar con lo que hay a la mano.

OpenAI aún no ha hecho pública esta parte de la tecnología, pero una empresa llamada Be My Eyes ya está utilizando GPT-4 para crear servicios que podrían dar una idea más detallada de las imágenes que se encuentran en internet o se toman en el mundo real.

Ahora cuenta con conocimientos sólidos.

Una tarde reciente, Anil Gehi, profesor adjunto de Medicina y cardiólogo de la Universidad de Carolina del Norte en Chapel Hill, describió al chatbot el historial médico de un paciente al que había atendido un día antes, incluidas las complicaciones que sufrió tras su ingreso en el hospital. La descripción contenía varios términos médicos que alguien no especializado no reconocería.

Cuando Gehi le preguntó cómo debería haber tratado al paciente, el chatbot le dio la respuesta perfecta. “Así es exactamente como tratamos al paciente”, relató.

Cuando probó otros escenarios, el bot dio respuestas igual de impresionantes.

Es poco probable que esos conocimientos se pongan de manifiesto cada vez que se utilice el bot. Sigue necesitando expertos como Gehi para juzgar sus respuestas y llevar a cabo los procedimientos médicos. Pero puede demostrar ese tipo de conocimientos en muchas áreas, desde la programación informática hasta la contabilidad.

Puede ser competencia para los editores.

Cuando se le proporciona un artículo de The New York Times, el nuevo chatbot casi siempre puede dar un resumen preciso y exacto del artículo. Si se añade una frase al azar al resumen y se le pregunta al bot si el resumen es inexacto, señala la frase añadida.

Etzioni afirma que se trata de una habilidad extraordinaria. “Para hacer un resumen de alta calidad y una comparación de alta calidad, debe tener un nivel de comprensión de un texto y la capacidad de articular esa comprensión”, señaló. “Esa es una forma avanzada de inteligencia”.

Está adquiriendo un sentido del humor, más o menos.

Etzioni pidió al nuevo bot “un chiste novedoso sobre la cantante Madonna”. La respuesta le impresionó. También le hizo reír. Si conoces los grandes éxitos de Madonna, puede que también te impresione.

El nuevo bot seguía teniendo problemas para escribir algo que no fueran chistes malos típicos de los padres. Pero era ligeramente más gracioso que su predecesor.

Puede razonar, hasta cierto punto.

Etzioni planteó un acertijo al nuevo bot.

El sistema pareció responder adecuadamente. Pero la respuesta no tenía en cuenta la altura de la puerta, que también podría impedir el paso de un tanque o un auto.

El director general de OpenAI, Sam Altman, dijo que el nuevo bot podía razonar “un poco”. Pero su capacidad de razonamiento se viene abajo en muchas situaciones. La versión anterior de ChatGPT manejó la pregunta un poco mejor porque reconoció que la altura y la anchura importaban.

Es muy bueno con las pruebas estandarizadas.

OpenAI afirma que el nuevo sistema podría calificar entre el diez por ciento de los mejores estudiantes en el Examen Uniforme de Certificación de Abogados, que otorga la facultad de ejercer la abogacía en 41 estados y territorios. También puede obtener una puntuación de 1300 (sobre 1600) en el examen estandarizado de aptitud académica (SAT, por su sigla en inglés) y un cinco (sobre cinco) en los exámenes del programa de colocación avanzada en las materias universitarias de biología, cálculo, macroeconomía, psicología, estadística e historia, según las pruebas de la empresa.

Las versiones anteriores de la tecnología no superaron el Examen Uniforme de Certificación de Abogados y no obtuvieron puntuaciones tan altas en la mayoría de los exámenes de colocación avanzada.

Una tarde reciente, para demostrar su capacidad, Brockman le hizo al nuevo bot una pregunta de examen del colegio de abogados sobre un hombre que tiene un negocio de reparación de camiones diésel.

La respuesta fue correcta, pero estaba llena de jerga jurídica. Brockman le pidió al bot que explicara la respuesta en inglés sencillo que pudiera entender cualquiera. También lo hizo.

No es bueno para hablar del futuro.

Aunque el nuevo bot parecía razonar sobre cosas que ya habían ocurrido, era menos hábil cuando se le pedía que formulara hipótesis sobre el futuro. Parecía basarse en lo que otros habían dicho en lugar de crear nuevas conjeturas.

Cuando Etzioni preguntó al nuevo bot: “¿Cuáles son los problemas importantes que hay que resolver en la investigación de PNL durante la próxima década?” —refiriéndose al tipo de investigación sobre “procesamiento del lenguaje natural” que impulsa el desarrollo de sistemas como ChatGPT— no pudo formular ideas totalmente nuevas.

Y aún está alucinando.

El nuevo bot sigue inventando cosas. Este problema, denominado “alucinación”, acecha a todos los principales chatbots. Como los sistemas no saben qué es verdad y qué no, pueden generar textos completamente falsos.

Cuando se le pedían las direcciones de sitios web que describían las últimas investigaciones sobre el cáncer, a veces generaba direcciones de internet que no existían.

c.2023 The New York Times Company

TAMBIÉN TE PUEDE INTERESAR | EN VIDEO

Así será la sociedad con el desarrollo de la inteligencia artificial