Google lanza Gemini 2.5 y pone en aprietos a Photoshop: así funciona su versión Flash Image

La compañía presentó oficialmente Gemini 2.5 Flash Image, una nueva versión de su modelo de generación y edición de imágenes con inteligencia artificial.

El sitio web de Google Chrome en un smartphone instalado en el distrito de Queens, Nueva York, EE.UU., el martes 19 de noviembre de 2024.
28 de agosto, 2025 | 10:39 AM

Bloomberg Línea — Google, de Alphabet Inc (GOOGL), presentó esta semana Gemini 2.5 Flash Image, su modelo de generación y edición de imágenes de última generación.

Ver más: Apple considera integrar Gemini de Google en la renovación de Siri

PUBLICIDAD

Esta actualización, también conocida como nano-banana, permitirá combinar varias imágenes en una sola imagen, mantener la consistencia de los personajes para enriquecer la narrativa, realizar transformaciones específicas utilizando lenguaje natural y utilizar el conocimiento del mundo de Gemini para generar y editar imágenes, dijo la compañía en un comunicado anunciando el modelo de imagen de última generación.

La mejora responde a la retroalimentación de los usuarios de Gemini 2.0 Flash quienes, según Google, valoraban su baja latencia, rentabilidad y facilidad de uso, pero también pedían imágenes de mayor calidad y un control creativo más potente.

Desarrollado por Google DeepMind, este nuevo modelo de inteligencia artificial ya está disponible a través de la API de Gemini y Google AI Studio para desarrolladores y Vertex AI para empresas, y destaca por su capacidad para mantener la coherencia entre imágenes.

PUBLICIDAD

Su rendimiento ha generado tal repercusión que, según Business Insider, ya se perfila como una seria amenaza para Adobe Photoshop y otras herramientas de edición tradicionales.

En pruebas realizadas por el medio, Gemini 2.5 Flash Image logró resultados más precisos que sus competidores, incluso al realizar ediciones complejas como añadir accesorios o modificar colores sin perder detalles visuales importantes.

Más especificaciones

Además de sus mejoras técnicas, Gemini 2.5 Flash Image se integra con el modo “build” de Google AI Studio, que ahora permite probar rápidamente las capacidades del modelo, crear aplicaciones con un solo prompt o personalizar plantillas preestablecidas.

Ver más: Google redobla esfuerzos para convencer a los escépticos y venderles la IA

Estas funciones facilitan la construcción de apps de edición de imágenes que permiten cargar fotos, aplicar filtros y compartir resultados, todo desde la misma plataforma, sin necesidad de programación avanzada.

Entre otras capacidades del modelo destacan la consistencia visual de personajes u objetos a lo largo de múltiples ediciones, la adherencia a plantillas visuales y la edición localizada mediante lenguaje natural. El programa puede, por ejemplo, desenfocar fondos, eliminar manchas, cambiar poses o modificar colores con instrucciones simples.

También es capaz de comprender y fusionar múltiples imágenes, estilizar escenarios y generar activos visuales consistentes para marcas, catálogos o entornos educativos.

Gemini 2.5 Flash Image tiene un precio de US$30 por 1 millón de tokens de salida y cada imagen tiene 1.290 tokens de salida (US$0,039 por imagen).

PUBLICIDAD