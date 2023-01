La inteligencia artificial ha cobrado mucho protagonismo en los últimos años. Sin embargo, en 2022 vimos un despunte en cuanto a ciertas de sus aplicaciones para el mundo real. Y es que gracias al entrenamiento de complejos modelos de lenguaje, a día de hoy podemos hacer uso de multitud de herramientas con IA. Una de ellas es DALL-E 2, desarrollada por OpenAI.

La compañía ya ofreció detalles sobre su herramienta de generación de imágenes en 2021. Sin embargo, un año después mostró al público su siguiente versión, más capaz, y basada en el modelo de lenguaje GPT-3. DALL-E 2, junto a otras tantas como Stable Diffusion o Midjourney, fueron algunas de las herramientas de IA más populares de 2022, y en este artículo te explicamos todo acerca de la desarrollada por OpenAI.

DALL-E 2 es una herramienta de generación de imágenes por medio de inteligencia artificial. A través de lenguaje natural, es posible indicarle qué queremos que nos dibuje, y la IA creará una imagen única basada en la descripción que le hayamos dado.

Esto puede hacerlo gracias a que la herramienta está basada en GPT-3, un complejísimo modelo de lenguaje que ha sido entrenado con miles de millones de parámetros. Esto quiere decir que la inteligencia artificial siempre generará imágenes basadas en una amplia biblioteca de obras de arte y experiencias propias del ser humano recopiladas de Internet y con las que la compañía ha ido alimentando su modelo de lenguaje para hacerlo más capaz.

La herramienta es capaz de combinar conceptos, atributos o estilos para generar la imagen, por lo que además de explicarle qué es lo que quieres que te dibuje, también puedes describirle en qué estilo quieres que te genere la imagen.

Para generar las imágenes hace uso de un proceso conocido como 'difusión', el cual empieza con un modelo de puntos aleatorios que gradualmente va alterando cuando la IA empieza a reconocer ciertos aspectos de la imagen.

Si bien en 2021 OpenAI presentó DALL-E al mundo, un año más tarde sorprendía con las capacidades de DALL-E 2, pudiendo generar imágenes mucho más realistas y precisas, además de aumentar en hasta 4 veces la resolución de la imagen.

OpenAI puso la herramienta a disposición de solo unos pocos, aunque a día de hoy todo el mundo puede entrar y probarla gratis. Sin embargo, no podemos generar imágenes de manera ilimitada, sino que tendremos una serie de créditos iniciales que estos se irán gastando a cada imagen que generemos.

Para probar la herramienta, lo único que tienes que hacer es ir a la web oficial de DALL-E 2 y registrarte, o iniciar sesión a través de Google o Microsoft. Una vez hayas iniciado sesión, ya podrás usar la herramienta sin problemas.

Para dar comienzo a tu primera creación, basta con describir la imagen que deseas generar en el cuadro de texto que aparece en el centro de la página. Ten en cuenta que cuanto más detalle en la descripción, más se ajustará a nuestras preferencias. Además, podemos decirle a la IA el estilo en el que queremos ver dibujada la imagen, pudiendo citar a autores célebres, o estilos artísticos en concreto.

Al presionar sobre el botón para generar la imagen, la IA te mostrará cuatro ejemplos distintos y quedarán registrados en tu historial, por lo que podrás ver las imágenes siempre que quieras.

Además de poder generar imágenes, la herramienta también nos permite editar las fotos que nosotros mismos subamos. De esta forma, podremos cambiar el estilo artístico de la imagen, e incluso agregar o quitar elementos en ella. Para hacer uso de esta función lo único que tenemos que hacer es presionar sobre 'Upload an image' bajo el cuadro de introducción de texto.

Aquí se nos abrirá todo un cuadro de puntos donde si seleccionamos la herramienta de 'Add generation frame', podremos añadir todo tipo de elementos a cualquier lugar de la imagen. También podemos modificar los elementos con tan solo pedírselo a la IA.

La clave para conseguir un resultado similar o idéntico a lo que necesites es dar con la descripción ideal para la imagen. Aquí hay todo un estudio detrás en cuanto al procesamiento de descripciones en lenguaje natural. En los últimos meses esto se ha convertido en todo un arte, conocido en Internet como 'Prompt engineering'. Si andas perdido a la hora de crear una descripción para que la IA te genere una imagen, siempre puedes consultar webs que te ayudarán a proceder con la descripción idonea.

Para generar una buena descripción debes cerciorarte en expresar con todo lujo de detalles lo que quieres que aparezca en pantalla. Una vez lo tengas, puedes completar con el estilo artístico en el que quieres ver la imagen, y parámetros como resolución, índice de detalle, etc. Te dejamos con algunos ejemplos para que puedas hacer uso de DALL-E 2 sin dificultades.

"A black and white photograph of a samurai walking through an alley in Tokyo lit by torchlights at night".

Traducción: "Fotografía en blanco y negro de un samurai caminando de noche por un callejón de Tokio iluminado por antorchas".