Sora: qué es y cómo funciona la IA de OpenAI para generar videos

Sora: qué es y cómo funciona la IA de OpenAI para generar videos

OpenAI anunció su más reciente herramienta de inteligencia artificial (IA) llamada Sora, un nuevo generador de texto a video que crea resultados realistas. 

Esta IA puede crear clips de hasta un minuto de duración y los archivos están diseñados para ser de alta calidad y de una alta definición.

OpenAI, a través de su cuenta en X, publicó algunas de las escenas creadas por Sora: una cámara sigue se mueve por las calles de Tokio, siguiendo a dos personas que caminan entre árboles de cerezos; varios mamuts corriendo en una montaña nevada; o incluso, el tráiler de una película sobre un astronauta situado en un desierto de sal.

Sora: qué es y cómo funciona la IA de OpenAI para generar videos - sora-ai-2-1280x712

¿Qué es Sora?

‘Sora’ es el término en japonés para ‘cielo’ y es capaz de crear escenas realistas de video de hasta 60 segundos a partir de instrucciones de texto, con un resultado detallado, un movimiento de cámara complejo y múltiples personajes con emociones.

Sora se une así a la familia de herramientas creativas de OpenAI, como ChatGPT y Dall-E, que pueden generar texto e imágenes a partir de texto, respectivamente.

¿Cómo funciona?

Sora funciona mediante un proceso llamado difusión, que consiste en generar un video a partir de un video borroso y lleno de ruido, y suavizar progresivamente hasta obtener un resultado de alta calidad y coherente con el texto de entrada.

Para la creación de estos videos, los usuarios tan solo deberán escribir una serie de indicaciones detallando qué características tiene que incluir la escena.

Deben ser específicos y detallar los personajes y las acciones que llevarán a cabo, el entorno, el clima, y los movimientos de cámara que se debían recrear.

Por ejemplo, uno de los videos de muestra que compartió OpenAI tiene las siguientes indicaciones:

  • Primer plano del parpadeo del ojo de una mujer de 24 años, de pie en Marrakech durante el atardecer, película cinematográfica rodada en 70mm, profundidad de campo, colores vivos, cinematográfico.

¿Cuándo se podrá probar?

Sora todavía no está disponible para el público general, sino que se encuentra en una fase de prueba limitada, en la que solo un pequeño número de investigadores y creativos pueden acceder al modelo y experimentar con él. 

OpenAI no ha anunciado una fecha concreta para el lanzamiento público de Sora, pero ha expresado su intención de hacerlo accesible para todos en el futuro, siguiendo sus principios de transparencia y apertura.

Sin embargo, OpenAI también ha advertido de los posibles riesgos y desafíos que supone Sora, especialmente en relación con el problema de los deepfakes, que son videos falsos generados por IA que pueden manipular la realidad y engañar a las personas. 

Por ello, OpenAI se compromete a desarrollar y aplicar medidas de seguridad y ética para garantizar el uso responsable y beneficioso de Sora.