Hace dos semanas, nos hacíamos eco del lanzamiento de DALL-E 2, la nueva inteligencia artificial de Open AI que parece capaz de generar cualquier imagen que seamos capaces de imaginar. Bueno, y de describir, porque esta IA no destaca sólo por crear imágenes, sino que previamente es capaz de 'comprender' textos para 'saber' qué le estamos pidiendo (lo cual logra recurriendo a la misma tecnología que la IA generadora de textos GPT-3).

DALL-E 2 sorprendió a todos por el salto que suponía con respecto a DALL-E, especialmente en la precisión, calidad y resolución de las imágenes generadas. Además, también se le añadieron nuevas funcionalidades:

Inpainting: DALL-E 2 es capaz de realizar cambios en imágenes preexistentes modificando aspectos de la misma o insertando nuevos elementos.

Variaciones: Es capaz de crear variaciones sobre una imagen original, utilizando el mismo tema y estilo visual (o sólo uno de ambos).

Pero, al mismo tiempo que nos hacíamos eco de la noticia, en Reddit se creaba la comunidad r/dalle2, a modo de foro que reúne las aportaciones de aquellos (pocos) usuarios que ya han tenido acceso al generador de imágenes que provee Open AI (hay que apuntarse a una 'lista de espera' para ello). Un foro, por cierto, que por ahora es el segundo cuya popularidad más ha aumentado en todo Reddit.

Estos usuarios han ido subiendo algunas de las creaciones más destacadas de la IA, y lo cierto es que cuantas más imágenes aparecen online, más sorprendidos nos quedamos algunos con el potencial de esta tecnología.

Estas son algunas de las imágenes (acompañadas de las descripciones usadas para generarlas) que más nos han impresionado… y que nos hacen pensar que, al contrario de lo que hubiéramos imaginado, la de ilustrador quizás sea una de las profesiones más amenazadas por la IA:

Un vistazo a… ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

Un bebé de perezoso…

"Un achuchable bebé de perezoso con un gorro de punto tratando de saber para qué sirve un portátil, [mostrado] de cerca, con alto nivel de detalle, iluminación de estudio y la pantalla reflejándose en sus ojos" (A fluffy baby sloth with a knitted hat trying to figure out a laptop, close up, highly detailed, studio lighting, screen reflecting in its eyes).

Otto von Garfield

‎"Cuadro del gato naranja Otto von Garfield, conde de Bismarck-Schönhausen, duque de Lauenburg, ministro-presidente de Prusia. Representado vistiendo un [casco] Pickelhaube prusiano y comiendo su comida favorita: lasaña" (Painting of the orange cat Otto von Garfield, Count of Bismarck-Schönhausen, Duke of Lauenburg, Minister-President of Prussia. Depicted wearing a Prussian Pickelhaube and eating his favorite meal - lasagna)

Casa de muñecas

"Casa de muñecas que replica un edificio que está siendo invadido por la naturaleza, depositada dentro de ese mismo edificio" (A dollhouse replica of a building being reclaimed by nature, left inside that same building).

Lo más chocante de DALL-E 2 no es el realismo que pueden llegar a alcanzar sus imágenes, sino el modo en que es capaz de fusionar conceptos

Wild Wild West

"‎Cuadro steampunk del antiguo Oeste de un buey cyborg tirando de un carro [modelo] Conestoga‎" (Steampunk old western painting of a cyborg ox pulling a Conestoga wagon)

El Códice Tuitensis

"Manuscrito medieval que represente una explicación de Internet‎" (medieval manuscript depicting an explanation of the internet).

Artistas mapaches

"Una foto de orgullosos artistas mapaches posando al lado de sus cuadros" (A photo of proud raccoon artists posing next to their paintings).

Hasta un videoclip

Karen X. Cheng ha creado incluso un vídeo musical usando a DALL-E 2 para ir generando las diferentes imágenes que lo componen. Eso sí, reconoce que se ha tomado algunas 'licencias artísticas', pues viendo el vídeo es posible pensar que la generación de imágenes es inmediata (no lo es, tarda "unos 10 segundos"), o que la imagen generada puede volver a modificarse sin necesidad de volver a subir el fichero original.

Obviando esos detalles, el vídeo nos proporciona una idea del potencial de DALL-E 2: