"Mueve la cabeza hacia la izquierda, foto". Esta herramienta interactiva de IA inaugura una nueva era en la edición de imágenes

¿Manipular una foto para que tu suegro aparezca con los ojos abiertos, tu perro mire a cámara o ese montecillo al que fuiste de excursión parezca un primo del Everest? Bueno, eso ya es posible gracias a Adobe Photoshop y el resto de editores fotográficos del mercado.

Pero, claro, las herramientas que dicho software proporciona requieren una gran habilidad (y paciencia) para controlar con precisión la posición / forma / expresión / disposición de los elementos de la foto.

Un vistazo a…
11 RETOQUES FÁCILES de PHOTOSHOP para ser el MAESTRO de la EDICIÓN

No es muy diferente a querer retocar ilustraciones a fuerza de pincelada: artesanal, pero una opción poco factible para la mayoría de los usuarios.

Sin embargo, estamos en la era de la inteligencia artificial y un grupo de investigadores de inteligencia artificial ha hecho pública la existencia de una herramienta llamada DragCAN, en la que, mediante la manipulación generativa de imágenes, es capaz de proporcionar una alternativa a esa mayoría de usuarios.

"Con DragGAN, cualquiera puede deformar una imagen y tener un control preciso sobre dónde termina cada píxel".

DragGAN abre una categoría completamente nueva en el campo de la edición de imágenes, donde el usuario es capaz de personalizar imágenes fotorrealistas (ya sean fotos de verdad, ya sean imágenes creadas por otras IAs generativas)…

…a través de un mecanismo interactivo tan simple como es el de arrastrar y soltar; olvidémonos de los prompts de texto. En realidad, a efectos prácticos, se parece bastante a editar las fotos como si fueran modelos en 3D.

La clave de DragCAN es que, siempre y cuando haya sido entrenada en la clase de elemento de la imagen que estamos tratando de editar, la IA es capaz de aportar la información faltante en la imagen original: vamos, que podemos decirle que le abra la boca a un león, y será la herramienta la que se encargue de crear los colmillos y la lengua, por ejemplo.

En las imágenes de prueba publicadas por sus creadores, se observa que DragGAN permite realizar estas tareas indicando únicamente puntos de origen y de destino, con los cuales reconoce cuándo mover algo (como la cabeza de un león) y cuándo alterar su forma (como el largo de las mangas de una camiseta).

Según sus creadores, sólo sería necesario contar con una tarjeta como la NVIDIA RTX 3090 (en torno a 2.500 €) para realizar las tareas antes descritas en pocos segundos. Aunque, por desgracia, el software aún no está disponible para el público general.

Un pasito más hacia el futuro de las imágenes generadas por IA

Lo revolucionario de lo que ofrece DragGAN es la posibilidad de crear iteraciones constantes y controladas por el usuario de imágenes previas, lo cual también facilitará la creación de animaciones y cómics mediante IA.

No podemos evitar pensar que el futuro de la IA radica en integrar en las mismas herramientas funcionalidades estrictamente generativas (como Midjourney), de outpainting (como la que ya tiene integrada DALL-E 2), de edición interactiva de forma y posición (como este DragGAN) y de edición mediante prompts del aspecto de la imagen (como ControlNet).

En Genbeta | Photoshop dejará de mostrar miles de colores a no ser que pagues (más): si no pagas, solo verás negro

Ver todos los comentarios en https://www.genbeta.com

VER 0 Comentario

Portada de Genbeta