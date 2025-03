En 2025, la generación de imágenes mediante IA ha dejado de ser un concepto novedoso... pero la tecnología sigue avanzando a pasos agigantados. Y Google ha sabido convertirse en protagonista de uno (o varios) de estos pasos con el lanzamiento de Gemini Flash 2.0, una herramienta que cambia las reglas del juego en lo que respecta a la edición de imágenes.

A pesar de que existen otros productos en el mercado que ya ofrecen resultados impresionantes (MidJourney, Flux, etc.), lo que distingue a Gemini Flash 2.0 es su versatilidad, mucho más allá de la mera generación.

La revolución de la multimodalidad

Y es que, en un panorama donde la mayoría de las herramientas de generación de imágenes están centradas en la creación de las mismas desde cero a partir de un texto (o 'prompt'), el modelo Gemini Flash 2.0 de Google constituye un hito al ofrecer una función multimodal de forma nativa.

¿Qué significa esto? Que este sistema no solo puede generar imágenes a partir de descripciones textuales, sino que también es capaz de recibir imágenes externas como entrada para luego editarlas o combinarlas, lo que añade una capa de complejidad y creatividad sin precedentes.

Si bien OpenAI presentó un 'paper académico' con un concepto similar como función de GPT-4o, nunca habilitó el acceso público a la misma (teniéndonos que contentar con el, en comparación, limitadísimo uso del 'pincel' de DALL-E 3).

Esto ha dejado un espacio que Google ha sabido aprovechar con Gemini Flash 2.0, que se convierte así en un 'Photoshop inteligente' capaz de realizar modificaciones a nivel profesional sin necesidad de software complejo.

Ya puedes probarlo

Una de las características que hacen de Gemini Flash 2.0 una herramienta aún más atractiva es su accesibilidad. Google ha puesto a disposición del público la plataforma Google AI Studio, donde cualquier persona puede experimentar ya con esta tecnología de manera gratuita. Solo es necesario seleccionar la versión experimental con generación de imágenes del modelo 'Gemini 2.0 Flash' en la interfaz y comenzar a probar sus funcionalidades.

Gemini Flash 2.0 destaca a la hora de permitir que los usuarios ajusten elementos concretos de una imagen sin alterar el resto (fondo, iluminación, objetos presentes en una escena...) todo a través de comandos textuales. Y las ediciones no se limitan a ajustes superficiales: esta IA nos permite modificar elementos más detallados, como la proporción de un objeto o la posición de los elementos dentro de una composición.

Usos profesionales. En el mundo del diseño y la creatividad, esta herramienta puede transformar el proceso de prototipado. Por ejemplo, un diseñador puede cargar una imagen de una habitación y experimentar con diferentes configuraciones de muebles, colores y decoraciones sin necesidad de usar software pesado o pasar por largos procesos de edición.

Limitaciones técnicas. En algunos casos, el resultado no es tan preciso como cabría esperar, mostrando la imagen resultante algunas distorsiones. No obstante, tal limitación es comprensible si se tiene en cuenta que Gemini Flash 2.0 es una versión ligera del modelo, diseñada para ofrecer resultados rápidos (es de esperar el lanzamiento futuro una versión más robusta, Gemini 2.0 Pro).

La polémica eliminación de marcas de agua

Está siendo también muy comentado un uso inesperado de esta IA en el que se ha revelado extraordinariamente competente: la eliminación de marcas de agua, como evidencia esta hilo de Reddit. Herramientas como Watermark Remover.io ya permiten eliminar marcas de agua de imágenes de empresas como Shutterstock, pero la capacidad avanzada de Gemini 2.0 Flash parece superar a las opciones previas.

Sin embargo, esto podría tener consecuencias legales: plataformas de pago como Getty Images se han basado en el uso de las marcas de agua como medio para proteger el copyright de sus activos digitales, y la capacidad de Gemini 2.0 Flash de eliminarlas podría obligar a estas empresas a replantear sus estrategias de seguridad.

Hasta el momento, Google no ha dado una respuesta clara sobre si implementará restricciones más estrictas en Gemini 2.0 Flash en materias como esta o en el de la generación de imágenes de figuras públicas. No es que dichos controles no existan (la IA en algunos casos se niega a cumplir con la solicitud del usuario de suprimir la marca de agua), pero sí es cierto que no parecen ser demasiado robustos.

