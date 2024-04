Desde el lanzamiento de ChatGPT, vivimos en una era de competición y democratización de la inteligencia artificial que en la práctica nos permite disfrutar de potentes herramientas gratis: el chatbot de GPT, Microsoft Copilot con GPT-4 y Dall-E o Google con Gemini son algunas de las más populares. Entre ellas está ImageFX, un generador de imagénes gratis basado en Imagen 2. Hemos probado ImageFX y estas han sido nuestras primeras impresiones.

Cómo entrar a ImageFX

Lo primero de todo es recordar que ImageFX no está disponible en España: se encuentra a través de Google Labs, haciendo scroll hacia abajo aparecerá esta herramienta y la posibilidad de probarla simplemente tocando 'Try it now'. Eso sí, teniendo en cuenta que solo puede usarse en Australia, Estados Unidos, Kenia y Nueva Zelanda, si accedemos desde una localización diferentes nos encontraremos con la opción de dejar nuestro email de Google para recibir una notificación cuando esté disponible aquí.

Pero hay otra vía: usar una VPN o mucho más fácil, basta con tirar del navegador Opera con el VPN activado (que en realidad usa proxy). En mi caso he usado tanto NordVPN como Opera con el VPN seleccionando ubicación América y en ambos casos he podido usarlo sin problema. A partir de ahí, tocará meter nuestro correo de Google personal y empezar.

Primeros pasos con ImageFX

Lo primero que veremos cuando ImageFX se cargue es lo que veis bajo estas líneas, que deja muy poco margen a líos: el cajetín de la izquierda permite introducir un prompt de texto detallando qué queremos que genere y hay dos botones: uno para reiniciar ('Start over') y otro 'I'm feeling lucky' viejo conocido para quienes llevamos tiempo usando Google: el clásico 'voy a tener suerte', que básicamente es dejar que Google fluya y deje volar su imaginación. Abajo del todo, un disclaimer advirtiendo que las generaciones de la IA pueden ser ofensivas o imprecisas.

No obstante, conforme empiezas a escribir algo de texto, el botón de la suerte deja su espacio a 'Generate'. Por ejemplo, empiezo con un tanteo 'a little mouse typing in front of a computer, comic image', es decir, una ratita tecleando delante de un ordenador con una imagen de estilo cómic. Al tocar el botón, comienzan unas animaciones en pantalla y aparece el mensaje 'optimizing your prompt' (optimizando la orden).

Un punto interesante es que tras esta primera ejecución, en la parte inferior aparecen conceptos que pueden ayudarnos a depurar el prompt, como por ejemplo painting o ilustration. En la zona superior de los resultados es posible ir recuperando las imágenes generadas durante la sesión

Si te fijas también quedan remarcadas algunas palabras, apareciendo un menú desplegable que sirve para matizar y esto es un factor diferencial que ayuda mucho a mejorar como prompter. Me explico: cuando empiezas de cero con la IA es habitual dar pocos detalles y dar cosas por entendidas, pero con esto conforme probamos, iremos viendo más detalles a añadir y cómo hacerlo.

Un ejemplo: he puesto ordenador, pero podría haber sido más específica (un portátil) u optar por otros dispositivos como una tablet o un móvil.

En la zona de las imágenes generadas también aparecen nuevos botones fácilmente reconocibles: el de compartir, descargar y también uno menos común que resulta de lo más útil: un par de barras de ajuste. Si tocamos, se muestra algo que viene de lujo: un número de referencia y un candado.

Si tras varias iteraciones damos con algo que nos gusta y queremos mantener para el futuro (o igual nos gusta este primer resultado), bastará con bloquear la referencia tocando sobre el candado para guardarla y que así futuras generaciones puedan basarse en ese bloqueo.

En pocas palabras: ImageFX tiene una interfaz intuitiva pero a la vez completa, con funciones que nos ayudan a mejorar en la introducción de prompts y de seguir iterando a partir de una base que podemos fijar. Y no es un tema baladí porque la competencia mainstream no lo tiene: acostumbro a usar Microsoft Copilot Designer porque es gratis y lo echo en falta.

Nota: para ganar en precisión he usado el inglés, pero puede usarse castellano y reconoce igualmente esos topics a modificar, aunque los resultados son peores.

En cuanto a resultados, tiene bastante tiene margen de mejora, especialmente a la hora de reflejar escenas realistas y naturales en humanos, si bien las escenas más creativas las resuelve bien. Asimismo, me ha sorprendido gratamente a la hora de generar imágenes con texto.

Algunos prompts que he usado y sus resultados:

Un lobo vestido de ejecutivo, con un maletín en la mano, entrando en una oficina. Imagen realista.

un circuito de ordenador y en el centro, escrito con cables, la palabra 'Genbeta'. Alto nivel de detalle, cinemático.

Una chica que está jugando a padel en la azotea de un edificio de Madrid





