DALL-E mini ha puesto una impresionante IA al alcance de todo el mundo: así puedes crear tus propias imágenes

DALL-E mini ha puesto una impresionante IA al alcance de todo el mundo: así puedes crear tus propias imágenes
1 comentario

Hace unos días apareció en Internet DALL-E Mini, una IA basada en el modelo proporcionado por OpenAI, aunque creada a partir de un modelo de lenguaje open-source. No siempre consigue los resultados de DALL-E 2 (sobre todo porque desfigura las caras y aún tiene que mejorar en las expresiones), y es que hay que entender que aún se encuentra en periodo de entrenamiento.

Pero aun así, su gran logro es que está a disposición de todo el mundo (y, de hecho, hay diseños geniales). Tal ha sido su popularidad que ha habido momentos en los que tarda mucho tiempo en hacerte el diseño, porque el tráfico se ha congestionado, pero hay otros momentos en los que es posible hacer realidad la idea que tienes en mente, en cuestión de segundos.

Si te aparece el siguiente mensaje es que el tráfico ha saturado la web y deberás esperar a otra hora del día o tener esperanza en que los creadores puedan ir mejorándola para que vaya aguantando el enorme tráfico mundial que recibe. Por nuestra experiencia, tienes más opciones de conseguir usar esta IA por la mañana.

Firefox Baitfh4l0m

Desde Genbeta la hemos probado y queremos explicarte cómo hacer de una idea que tengas en mente, por muy rocambolesca que sea, una imagen real gracias a la Inteligencia Artificial.

Un vistazo a…
ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

Usando DALL-E mini paso a paso

Lo primero es acceder a esta herramienta a través de este enlace. Es una herramienta creada por Hugging Face. "DALL-E mini es un modelo de IA que genera imágenes a partir de cualquier indicación que le des", explican en la propia web.

En esta página ves que hay una barra donde puedes escribir. La idea que quieres puedes escribirla en inglés para mayor precisión, aunque hemos comprobado que también funciona en castellano. Si no hablas inglés y prefieres probar así, siempre puedes usar uno de más usados traductores para ayudarte a pasar una frase desde tu lengua al inglés.

Puedes ser DeepL o Google Translate, por ejemplo. Solo tienes que pensar una idea, algo o a alguien a quien te gustaría ver haciendo algo. Y describirlo. Por ejemplo: a huge cat eating tacos at the beach y pulsar el cuadradito donde pone "Run" al lado de la barra. En este caso, aquí puedes ver cómo ha salido un gato gigante, tortillas de tacos y arena y mar:

Firefox Tqm6056wbj

También probamos a darle una idea en castellano y más o menos la entiende. En este caso le pedimos imágenes de Alejandro Sanz (que está en plena gira por España) bailando flamenco en Miami. En los resultados no parece estar bailando, sino tocando la guitarra, así que no fue nada desencaminado y DALL-E mini entiende el castellano.:

Firefox Lg1trxbb74

De hecho, le pusimos otra prueba más fácil en este idioma, pidiendo "una casa de piedra en el kilimanjaro" y, efectivamente, aquí tenemos una casa de estas características frente a esta impresionante montaña africana:

Firefox Vqz5j5wdis

Las fortalezas de esta herramienta

Los resultados, como has podido ver, nada tienen que ver con los de DALL-E 2 que son hiper realistas y precisos. Aquí estamos ante una herramienta open source, con muchas posibilidades de desarrollo y que cualquiera puedes usar, a diferencia de DALLE-2 que da resultados hiper realistas.

Hemos hecho una comparativa con una imagen preciosa que teníamos de "Un achuchable bebé de perezoso con un gorro de punto tratando de saber para qué sirve un portátil, [mostrado] de cerca, con alto nivel de detalle, iluminación de estudio y la pantalla reflejándose en sus ojos" (en inglés, como era el original).

Mientras que con DALLE-2 se ve así:

dalle-2

Escribiendo la misma frase en inglés en la versión de código abierto, (A fluffy baby sloth with a knitted hat trying to figure out a laptop, close up, highly detailed, studio lighting, screen reflecting in its eyes), obtenemos estos resultados:

Firefox R0glyik7la

Las imágenes tienen mucho por mejorar sobre todo lo que es el rostro de animales y de personas. Pero aún así, su enorme fortaleza es esa capacidad de entender un texto, aunque sea tan largo como este último y darle forma en cuestión de segundos.

Esto se puede comprobar muy bien en esta imagen. Le hemos pedido a Angela Merkel haciendo senderismo en el Everest (esta vez en inglés también). Nadie podría saber que estamos viendo imágenes de la antigua mandataria germana si nos fijamos en el rostro, pero sí usa las vestimentas propias de Merkel para darnos el resultado final:

Firefox Uxgx9aacxy

Temas
Inicio