DALL-E 2, guía a fondo: qué es, cómo funciona y todo sobre la IA de generación de imágenes de OpenAI

DALL-E 2, guía a fondo: qué es, cómo funciona y todo sobre la IA de generación de imágenes de OpenAI
Sin comentarios Facebook Twitter Flipboard E-mail

La inteligencia artificial ha cobrado mucho protagonismo en los últimos años. Sin embargo, en 2022 vimos un despunte en cuanto a ciertas de sus aplicaciones para el mundo real. Y es que gracias al entrenamiento de complejos modelos de lenguaje, a día de hoy podemos hacer uso de multitud de herramientas con IA. Una de ellas es DALL-E 2, desarrollada por OpenAI.

La compañía ya ofreció detalles sobre su herramienta de generación de imágenes en 2021. Sin embargo, un año después mostró al público su siguiente versión, más capaz, y basada en el modelo de lenguaje GPT-3. DALL-E 2, junto a otras tantas como Stable Diffusion o Midjourney, fueron algunas de las herramientas de IA más populares de 2022, y en este artículo te explicamos todo acerca de la desarrollada por OpenAI.

¿Qué es DALL-E 2?

DALL-E 2 es una herramienta de generación de imágenes por medio de inteligencia artificial. A través de lenguaje natural, es posible indicarle qué queremos que nos dibuje, y la IA creará una imagen única basada en la descripción que le hayamos dado.

Dalle Ejemplos

Esto puede hacerlo gracias a que la herramienta está basada en GPT-3, un complejísimo modelo de lenguaje que ha sido entrenado con miles de millones de parámetros. Esto quiere decir que la inteligencia artificial siempre generará imágenes basadas en una amplia biblioteca de obras de arte y experiencias propias del ser humano recopiladas de Internet y con las que la compañía ha ido alimentando su modelo de lenguaje para hacerlo más capaz.

La herramienta es capaz de combinar conceptos, atributos o estilos para generar la imagen, por lo que además de explicarle qué es lo que quieres que te dibuje, también puedes describirle en qué estilo quieres que te genere la imagen.

Dalle Ejemplos 2
Robomojo es una web que recopila carteles de películas generados por DALL-E 2

Para generar las imágenes hace uso de un proceso conocido como 'difusión', el cual empieza con un modelo de puntos aleatorios que gradualmente va alterando cuando la IA empieza a reconocer ciertos aspectos de la imagen.

Si bien en 2021 OpenAI presentó DALL-E al mundo, un año más tarde sorprendía con las capacidades de DALL-E 2, pudiendo generar imágenes mucho más realistas y precisas, además de aumentar en hasta 4 veces la resolución de la imagen.

¿Cómo usar DALL-E 2?

OpenAI puso la herramienta a disposición de solo unos pocos, aunque a día de hoy todo el mundo puede entrar y probarla gratis. Sin embargo, no podemos generar imágenes de manera ilimitada, sino que tendremos una serie de créditos iniciales que estos se irán gastando a cada imagen que generemos.

Dalle

Para probar la herramienta, lo único que tienes que hacer es ir a la web oficial de DALL-E 2 y registrarte, o iniciar sesión a través de Google o Microsoft. Una vez hayas iniciado sesión, ya podrás usar la herramienta sin problemas.

Para dar comienzo a tu primera creación, basta con describir la imagen que deseas generar en el cuadro de texto que aparece en el centro de la página. Ten en cuenta que cuanto más detalle en la descripción, más se ajustará a nuestras preferencias. Además, podemos decirle a la IA el estilo en el que queremos ver dibujada la imagen, pudiendo citar a autores célebres, o estilos artísticos en concreto.

Dalle 2

Al presionar sobre el botón para generar la imagen, la IA te mostrará cuatro ejemplos distintos y quedarán registrados en tu historial, por lo que podrás ver las imágenes siempre que quieras.

Además de poder generar imágenes, la herramienta también nos permite editar las fotos que nosotros mismos subamos. De esta forma, podremos cambiar el estilo artístico de la imagen, e incluso agregar o quitar elementos en ella. Para hacer uso de esta función lo único que tenemos que hacer es presionar sobre 'Upload an image' bajo el cuadro de introducción de texto.

Dalle 3

Aquí se nos abrirá todo un cuadro de puntos donde si seleccionamos la herramienta de 'Add generation frame', podremos añadir todo tipo de elementos a cualquier lugar de la imagen. También podemos modificar los elementos con tan solo pedírselo a la IA.

Ideas para usar DALL-E 2

La clave para conseguir un resultado similar o idéntico a lo que necesites es dar con la descripción ideal para la imagen. Aquí hay todo un estudio detrás en cuanto al procesamiento de descripciones en lenguaje natural. En los últimos meses esto se ha convertido en todo un arte, conocido en Internet como 'Prompt engineering'. Si andas perdido a la hora de crear una descripción para que la IA te genere una imagen, siempre puedes consultar webs que te ayudarán a proceder con la descripción idonea.

Para generar una buena descripción debes cerciorarte en expresar con todo lujo de detalles lo que quieres que aparezca en pantalla. Una vez lo tengas, puedes completar con el estilo artístico en el que quieres ver la imagen, y parámetros como resolución, índice de detalle, etc. Te dejamos con algunos ejemplos para que puedas hacer uso de DALL-E 2 sin dificultades.

Ejemplo 1

Foto 1

"high detailed photo of bulldog wearing a jedi costume standing in a warrior pose, HD 8K".

Traducción: "foto muy detallada de un bulldog con un traje de jedi de pie y en una pose guerrera, HD 8K".

Ejemplo 2

Foto 2

"Two medieval lovers holding hands, standing in a field, medieval style painting".

Traducción: "Dos amantes medievales cogidos de la mano, de pie en un campo, pintura de estilo medieval".

Ejemplo 3

Samurai

"A black and white photograph of a samurai walking through an alley in Tokyo lit by torchlights at night".

Traducción: "Fotografía en blanco y negro de un samurai caminando de noche por un callejón de Tokio iluminado por antorchas".

¿Cuánto cuesta DALL-E 2?

Tal y como hemos mencionado, DALL-E 2 es una herramienta a la que podemos acceder de forma completamente gratuita. Sin embargo, por cada uso que le demos, gastaremos un crédito. Los nuevos usuarios disponen de 50 créditos completamente gratis, y la plataforma ofrece además 15 créditos cada mes.

Si te quedas sin intentos, siempre puedes comprar más créditos. Actualmente OpenAI nos ofrece 115 créditos adicionales a un precio de 15 dólares. Esta es la tarifa base, aunque siempre podemos optar por comprar más cantidad de créditos.

Limitaciones de DALL-E 2

La inteligencia artificial detrás de DALL-E 2 no es perfecta ni mucho menos. Además, desde OpenAI también han añadido limitaciones para no permitir que generemos imágenes de celebridades, desnudos, o personas que existan en la realidad.

En su página de GitHub también advierten de todos los riesgos que conlleva el uso de su herramienta, como la creación de contenido potencialmente dañino. Sin embargo, la compañía afirma tomado todo tipo de medidas para eliminar el contenido explícito de las imágenes que se generan con DALL-E 2.

DALL-E 2 cuenta con numerosos filtros para evitar el contenido sexual o violento. No obstante, la compañía advierte que el uso de 'sinónimos visuales' para generar contenido dañino es posible. Engañar a una IA para mostrar un resultado explícito no es tan complicado, y es una cuestión en lo que la compañía trabaja para mejorar la experiencia de su herramienta.

Las IAs se usan cada vez más, y puede suponer un riesgo para la industria artística

A día de hoy es posible encontrar conocidas herramientas de edición que integran DALL-E 2 para ayudar a los artistas con sus proyectos. Esto es posible gracias a pluggins de terceros que permiten el uso de estas inteligencias artificiales. De esta manera, puedes usar DALL-E 2 en Photoshop, por mencionar un ejemplo, y podremos editar partes de la imagen añadiendo o eliminando elementos con tan solo decírselo a la IA.

Photoshop
Imagen: Flying Dog

Otras empresas optan por integrar este tipo de inteligencias artificiales en sus productos. Es el caso de Microsoft, quienes han invertido mucho dinero en la tecnología de OpenAI y podemos encontrar DALL-E 2 tanto en Bing como en la herramienta Microsoft Designer.

El gremio de artistas ha mostrado en varias ocasiones su indignación sobre las imágenes que se generan a través de IA, ya que están basadas en el trabajo de miles de artistas.

Hacer uso de DALL-E puede ahorrar mucho tiempo en las tareas más repetitivas, por lo que puede ser una gran alternativa para agilizar los procesos creativos de muchas empresas. De hecho, ya hay compañías que han hecho uso de inteligencias artificiales para sus proyectos. Uno de los últimos ejemplos ha sido Martini, la popular marca de vermú, quienes han utilizado una IA para una de sus últimas campañas publicitarias.

Dalle Bing

Tristemente, uno de los riesgos del uso de este tipo de inteligencias artificiales es el reemplazo del trabajo de artistas, ya que hacer uso de una IA es mucho menos costoso para una empresa y obtiene con mayor velocidad los resultados. Existe un gran debate sobre ello, pues el gremio de artistas ha mostrado en varias ocasiones su indignación sobre las imágenes que se generan con las inteligencias artificiales, pues están basadas en el trabajo de miles de artistas, y ven como poco a poco su uso empieza a ser una tendencia para las empresas.

Imagen de portada | OpenAI

Comentarios cerrados
Inicio