OpenAI anuncia Sora: el vídeo generado por inteligencia artificial ya es una realidad

by Andreas  - febrero 19, 2024

Sora, que recibe su nombre de la palabra japonesa que significa «cielo», es la primera incursión de OpenAI en el vídeo generado por inteligencia artificial. En un anuncio oficial, la empresa afirma que Sora puede «crear escenas realistas e imaginativas a partir de instrucciones de texto». Cada vídeo puede durar aproximadamente un minuto y la calidad es lo que algunos han calificado de digna de Hollywood. Eso podría deberse a la capacidad de Sora para crear escenas complejas con múltiples personajes… e incluso comprender emociones.

OpenAI afirma que Sora no se lanzará al público en general hasta que un «equipo rojo» (equipo pretende ser el enemigo en la jerga de la ciberseguridad) haya tenido la oportunidad de analizar y escudriñar cada una de sus vulnerabilidades. Aunque no lo han dicho oficialmente, es probable que Sora se lance como parte de ChatGPT, donde podrás generar vídeos con sencillas instrucciones de texto.

Para poner la enormidad de este logro en perspectiva, el año pasado por estas fechas apenas podíamos generar imágenes realistas con IA. Ahora estamos a punto de tener a nuestro alcance imágenes generadas por inteligencia artificial dignas de Hollywood. Las cosas se van a poner muy interesantes.

Lo cierto es que Sora es sorprendente y los ejemplos que publicó OpenAI te dejarán con la boca abierta. Aquí van algunos:

Video: OpenAI

Prompt usado: «Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.»

Video: OpenAI

Prompt usado: «»A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.»

Video: OpenAI

Prompt usado: «Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.»

Video: OpenAI

Prompt usado: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.

Sora puede generar vídeos de hasta un minuto de duración con detalles intrincados, movimientos de cámara complejos y personajes que muestran emociones dinámicas. Este salto tecnológico no solo demuestra la destreza técnica de OpenAI, sino que marca un nuevo hito en el sector.

Los detalles:

  • Generación avanzada de vídeos: Sora destaca por su capacidad para producir vídeos de hasta 60 segundos a partir de mensajes de texto, con escenas muy detalladas y emociones realistas de los personajes. Esto contrasta con las ofertas de Pika y Runway, donde la tecnología se limita a generar clips mucho más cortos.
  • Comprensión de escenarios complejos: El modelo demuestra una comprensión excepcional del mundo físico y de los elementos que lo componen, interpretando y representando con precisión escenarios complejos a partir de descripciones textuales. Esta profunda comprensión permite crear vídeos con narrativas e interacciones sofisticadas.
  • Innovación técnica: Utilizando un enfoque de modelo de difusión y arquitectura transformadora, Sora representa un salto significativo en la generación de vídeo de IA. Emplea técnicas como el retitulado de DALL-E 3 para garantizar la fidelidad a las instrucciones del usuario, ampliando así los límites de lo que es posible con los contenidos generados por IA.

Las implicancias:

  • Disrupción en la industria del vídeo y el cine: La capacidad de Sora para generar vídeos largos, detallados y emocionalmente resonantes supone una amenaza disruptiva para la producción tradicional de vídeo y cine. Su capacidad para producir contenidos con rapidez y por una fracción del costo podría revolucionar el sector, desplazando la balanza de las creaciones dirigidas por humanos a las impulsadas por IA.
  • Peligro de uso indebido: Aunque las capacidades de Sora son impresionantes, también suscitan preocupación por la facilidad con la que se pueden crear vídeos realistas. Esto podría dificultar la distinción entre los contenidos reales y los generados por IA, lo que podría agravar los problemas relacionados con la desinformación y los «deepfakes» (= engaños o falsificaciones via «medios sintéticos» como la IA).
  • Oportunidades creativas: Desde un punto de vista más positivo, Sora abre nuevas vías para la creatividad, permitiendo a cineastas y creadores de contenidos hacer realidad sus visiones sin las limitaciones de la producción tradicional. Esta democratización de la creación de vídeo podría dar lugar a una oleada de contenidos innovadores, ampliando los límites de la narración y el arte visual.

¿Qué crees tu?

Actualización (marzo 2024): El modelo de vídeo generativo Sora de OpenAI ofrece clips generados por IA al estilo de Hollywood a partir de una sola indicación, superando a otros modelos de IA con su movimiento más avanzado y realista en vídeos de hasta un minuto de duración.

Las imágenes publicadas recientemente muestran una amplia gama de posibilidades, como un sofisticado recorrido aéreo por un museo y un Alien en Nueva York. Estos vídeos están impresionando a los espectadores por su calidad y detalle, aunque por ahora Sora sigue siendo exclusivo de OpenAI y de probadores selectos.

Fuente: Magna AI
  • {"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

    REGALO

    Quieres nuestro "Manual del Emprendedor Digital"?

    Quizás Te Interese...

    >