Los creadores de Stable Diffusion lanzan una herramienta para generar vídeos con IA a partir de texto: Stable Video Diffusion

  • La herramienta nos permitirá generar clips de vídeo con tan solo una descripción en texto

  • Sus modelos han sido publicados y si queremos probarla tendremos que apuntarnos a la lista de espera

Stable
Sin comentarios Facebook Twitter Flipboard E-mail

Entre los hitos que se han conseguido gracias a las tecnologías basadas en inteligencia artificial se encuentran las herramientas que nos permiten generar imágenes por medio de una simple descripción en texto. Es por ello que cuando herramientas como DALL-E o Stable Diffusion se lanzaron públicamente, agitaron la industria tecnológica al poder conocerse de primera mano de lo que una IA era capaz.

Hoy día, generar imágenes mediante una IA se ha convertido en el día a día de muchas personas, empresas y organizaciones. Los avances de Stability AI en torno a Stable Diffusion han sido sorprendentes, sobre todo tras el lanzamiento de su modelo SDXL 1.0 y en adelante. Ahora quieren dar un paso todavía mayor con la posibilidad de generar clips de vídeo con tan solo una descripción en texto.

Así de fácil será generar vídeo mediante IA

En base a esto, Stability AI anuncia oficialmente Stable Video Diffusion. Y es que tal y como has podido imaginar por el título, se trata de una herramienta que nos permitirá generar vídeos mediante inteligencia artificial y con tan solo describir brevemente lo que queremos ver. Para ello, el proyecto se basa en un complejo modelo de lenguaje para la generación de vídeo en alta resolución.

Muy a groso modo, la generación de vídeo conseguida por los actuales modelos de lenguaje se basaban en el entrenamiento de imágenes en 2D y aplicando capas de tiempo se conseguían generar pequeños clips de vídeo. Según el paper publicado por la empresa, el método de Stability AI consiste en tres claves principales: preentrenamiento de texto a imagen, preentrenamiento de vídeo y ajuste de vídeo en alta definición.

El modelo puede adaptarse a diversas tareas, entre ellas la posibilidad de generar vistas desde múltiples perspectivas con tan solo una única imagen. La compañía pretende seguir lanzando diversos modelos que extiendan esta base, algo similar al ecosistema que han creado en torno a Stable Diffusion.

El lanzamiento de esta herramienta es un gran paso evolutivo para la empresa, la cual se encuentra a la vanguardia en cuanto a la generación de contenido mediante inteligencia artificial.

Stability AI ha publicado el código de sus modelos de forma pública tanto en Github como en Hugging Face para poder ejecutarlo en local. Sin embargo, aquellos que quieran probar la herramienta de primera mano, tendrán que apuntarse a la lista de espera a la cual podemos acceder desde la misma web oficial de Stability AI.

Por el momento, desde la compañía han asegurado que la herramienta es exclusiva para fines de investigación, y que en el estado en el que se encuentra todavía no se pueden barajar fines comerciales. Aquellos que sean admitidos tras haber estado en lista de espera encontrarán una interfaz web dedicada a la generación de vídeo por medio de su nuevo modelo de lenguaje.

En Genbeta | WhatsApp tendrá un chatbot con inteligencia artificial en nuestra pantalla de inicio. Ya lo están probando en su beta

Inicio