Anuncios
U.S. markets closed
  • S&P 500

    5,304.72
    +36.88 (+0.70%)
     
  • Dow Jones

    39,069.59
    +4.29 (+0.01%)
     
  • Nasdaq

    16,920.79
    +184.79 (+1.10%)
     
  • Russell 2000

    2,069.67
    +21.26 (+1.04%)
     
  • Petróleo

    78.28
    +0.56 (+0.72%)
     
  • Oro

    2,345.20
    +10.70 (+0.46%)
     
  • Plata

    31.06
    +0.56 (+1.82%)
     
  • dólar/euro

    1.0848
    -0.0001 (-0.01%)
     
  • Bono a 10 años

    4.4670
    -0.0080 (-0.18%)
     
  • dólar/libra

    1.2745
    +0.0006 (+0.05%)
     
  • yen/dólar

    156.8880
    -0.0550 (-0.04%)
     
  • Bitcoin USD

    68,386.52
    -687.82 (-1.00%)
     
  • CMC Crypto 200

    1,479.55
    -4.64 (-0.31%)
     
  • FTSE 100

    8,317.59
    -21.64 (-0.26%)
     
  • Nikkei 225

    38,900.02
    +253.91 (+0.66%)
     

Google también tiene una herramienta para generar videos a partir de descripciones en texto

Algunos de los videos de muestra que puede crear la inteligencia artificial de Google a partir de una frase simple
Algunos de los videos de muestra que puede crear la inteligencia artificial de Google a partir de una frase simple

Google ha presentado Imagen Video, un sistema de generación de video de alta calidad a partir de texto, capaz de generar una amplia variedad de videos y animaciones en distintos estilos artísticos.

Imagen Video parte del trabajo realizado por Google en Imagen, el modelo basado en Inteligencia Artificial (IA) capaz de crear imágenes de gran realismo a partir de breves descripciones de texto que la compañía presentó en mayo.

El nuevo sistema se basa en una cascada de modelos de difusión de video y tiene capacidad para “generar videos de alta definición con alta fidelidad de fotogramas, fuerte consistencia temporal y comprensión profunda del lenguaje”, como detalla la compañía tecnológica en el texto de la investigación.

Cómo funciona

PUBLICIDAD

A partir de una descripción breve en texto, este sistema genera videos de alta definición de 1280 x 768 píxeles a 24 fotogramas por segundo (fps) de unos 5,3 segundos de duración y con una densidad de 126 millones de píxeles, aproximadamente.

Para conseguir este resultado, los investigadores de Google han entrenado el sistema con una base de datos interna de 14 millones de parejas de video y texto, y 60 millones de parejas de imagen y texto. También han recurrido a la base de datos pública LAION y sus 400 millones de conjuntos de datos de imagen y texto. El procesamiento de los datos ha permitido redimensionar las imágenes y los videos y alinearlos con los textos.

Los investigadores destacan algunas de las características particulares que presenta su sistema frente a otras propuestas, como la capacidad de generar videos con distintos estilos artísticos; la comprensión de la estructura tridimensional, pese a fallar un poco en la consistencia durante la rotación de un objeto; y de generar texto animado en una diversidad de estilos.

Meta ha presentado recientemente ‘Make-A-Video’, su sistema de inteligencia artificial capaz de generar un video corto de alta calidad a partir de una descripción en texto, que se basa en la tecnología de generación de imágenes ‘Make-A-Scene’.