Con sólo tres horas e inteligencia artificial, puedes crear un anuncio en vídeo como éste. Pero algunos lo encuentran inquietante

Si 2022 fue el año en que 'explotó' la generación de imágenes (aunque no ha terminado de hacerlo, y la tecnología aún nos sigue sorprendiendo), este año 2023 tiene pinta de estar llamado a ocupar un papel similar en el campo del vídeo.

Un ejemplo reciente del potencial de esta tecnología es un anuncio de una pizza que el usuario 'PizzaLater' ha compartido en Twitter, y que se ha convertido en viral gracias a la mezcla de reacciones que provoca:

  • Tiene un poco de '¡Madre mía, mira qué cosas permite hacer ya la tecnología!'.
  • Y otro poco de 'Oh, Dios, voy a tener pesadillas durante semanas por ver esto [pero no puedo dejar de mirar]'.

Bocas y miembros deformados, técnicas e instrumentos extraños de cocina aplicados a las pizzas, una voz en off que suena ligeramente siniestra al mismo tiempo que perfectamente realista…

Si, por el contrario, eres de los que ha quedado convencido por el anuncio y está decidido a llamar a Pepperoni Hug Spot ("Como la familia, pero con más queso") para pedir su pizza de "pepperoni, verduras e ingredientes secretos", te puedes ir olvidando…

Sólo 3 horas y mucha IA

…porque el anuncio fue sólo un experimento en el que 'PizzaLater' invirtió 3 horas usando diversas herramientas basadas en inteligencia artificial: ningún humano ni localización real se grabó para crear el anuncio, y tampoco nadie escribió el guión del mismo.

  • El citado papel de guionista, de hecho, recayó en manos de GPT-4 de OpenAI.
  • Las imágenes fijas se crearon mediante Midjourney, la plataforma de generación de imágenes más popular del momento.
  • Las escenas se han animado con otra herramienta basada en IA: Gen2 de Runway, que permite bien generar desde 0 vídeos a partir de prompts, bien aplicar el estilo de un vídeo a otro, o —como en este caso— usar imágenes preexistentes (las creadas con Midjourney) como base para el vídeo, acompañado opcionalmente de un prompt que describe la acción realizada.
  • Por otro lado, la voz de narración se la debemos a la IA de ElevenLabs (de la que ya hemos hablado en Genbeta gracias a su utilidad para clonar voces), mientras que la de generar la música de fondo es cosa de SOUNDRAW AI Music.
  • Luego, todo ese material se juntó en el anuncio final haciendo uso del software After Effects de Adobe.
El futuro pinta sabroso, sin duda

La conclusión del creador del anuncio se resume en uno de sus tuits:

"¡El futuro es salvaje!".

Si no entiendes su optimismo después de ver el videoclip, vuelve a pensártelo, y recuerda que hace un año lo que 'partía la pana' en el campo de la generación de imágenes eran cosas como DALL-E Mini, y a todos nos flipaba lo que podía hacer, por cutre que resulte a estas alturas.

Lo de convertir imágenes en vídeos, o la posibilidad de clonar perfectamente una voz y escribirle literalmente los diálogos, utilizando además para ello herramientas asequibles o directamente gratuitas, eran directamente opciones inexistentes.

Así que sí, el futuro es salvaje.

Eso no significa no que vaya a soñar esta noche con monstruos mutantes comepizzas, por desgracia.

Imagen | PizzaLater

En Genbeta | YouTube cumple 18 años: estos son los vídeos más vistos de cada año entre 2005 y 2023

Ver todos los comentarios en https://www.genbeta.com

VER 6 Comentarios

Portada de Genbeta