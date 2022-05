Hace unas semanas nos sorprendíamos con los resultados que ofrecía la inteligencia artificial de DALL-E 2 y analizábamos cómo verlas y cómo pedir una. Las imágenes se logran recurriendo a la misma tecnología que la IA generadora de textos GPT-3. También hemos podido ver cómo de realistas quedaron las fotografías de unas vacaciones buceando en el fondo del mar gracias al uso de esta IA.

Pues hoy vamos a ver las fotos que es capaz de crear gweb-research-imagen, que basa su tecnología en la Google AI (reconocida por tener capacidades tan avanzadas como que puede explicarte chistes). A continuación puedes ver ejemplos de fotografías con el texto debajo que se escribió para que la AI crease esa imagen.

IMAGEN es, según explican sus creadores, "un modelo de difusión de texto a imagen" en el que los resultados son realistas, según podemos ver en los resultados. IMAGEN se basa en inteligencia artificial de modelos lingüísticos para la comprensión del texto y se apoya en modelos de difusión para la generación de imágenes de alta fidelidad.

Para evaluar los modelos de texto a imagen con mayor profundidad, esta web también ha creado DrawBench. Con DrawBench se compara IMAGEN con métodos recientes, como VQ-GAN+CLIP o con DALL-E 2.

Como ves en los ejemplos de la anterior foto, puedes definir asuntos tan estrambóticos como: "una galería de arte con obras de Monet. La galería está inundada. Robots se mueven por la galería utilizando tablas de Paddle board". Y la herramienta ha creado una fotografía con esos requisitos, que parece realmente diseñada tras horas de trabajo.

De todos modos, no es posible crear nuestras propias fotografías: a diferencia de OpenAI es una herramienta más restrictiva, al menos por el momento. Como explica la propia web, para evitar riesgos no darán acceso a IMAGEN ni habrá demo pública. Como sucede con DAL-LE 2, las fotografías resultantes tienen una marca de agua en la esquina inferior derecha para identificar que no es una foto real, pero esta es fácilmente recortable con cualquier editor.

Jeff Dean, investigador senior de inteligencia artificial de Google AI ha compartido numerosas imágenes en su perfil de Twitter.

AI can unlock joint human/computer creativity! Imagen is one direction we are pursuing:https://t.co/LTlE3pqq4W



"A high contrast portrait of a very happy fuzzy panda dressed as a chef in a high end kitchen making dough. There is a painting of flowers on the wall behind him." pic.twitter.com/SrqEv9jeHf