OpenAI lanzó su nuevo modelo insignia de generación de imágenes, GPT Image 1-5, que promete velocidades de creación cuatro veces más rápidas y capacidades de edición más precisas a medida que la competencia se intensifica con el viral Nano Banana Pro de Google.
El modelo GPT Image 1.5 ya está disponible para todos los usuarios de ChatGPT a nivel mundial y a través de la API de la empresa. OpenAI dice que la actualización ofrece un mejor seguimiento de instrucciones, una mejor representación de texto y la capacidad de hacer ediciones específicas mientras se conservan detalles cruciales como la iluminación, los rasgos faciales y la composición.
La nueva interfaz de estudio creativo simplifica la generación de imágenes
La actualización introduce una sección dedicada a Imágenes en la barra lateral de ChatGPT, convirtiendo el chatbot en lo que OpenAI llama "un estudio creativo en tu bolsillo".
Los usuarios pueden acceder a filtros preestablecidos, indicaciones de tendencia y sugerencias de estilo sin escribir descripciones detalladas. La interfaz permite la generación continua de imágenes mientras otros se renderizan, eliminando los tiempos de espera entre creaciones.
"Crear y editar imágenes es un tipo de tarea diferente y merece un espacio construido para imágenes", escribió Fidji Simo, CEO de aplicaciones de OpenAI, en una publicación de blog anunciando el lanzamiento.
El modelo sobresale en varias técnicas de edición, incluyendo agregar, eliminar, combinar y transponer elementos. A diferencia de las versiones anteriores que a menudo reinterpretaban imágenes enteras cuando se les pedían pequeños cambios, GPT Image 1.5 modifica solo los elementos solicitados mientras mantiene la consistencia en múltiples ediciones.
OpenAI responde al dominio de la imagen de la IA de Google
El lanzamiento se produce tres semanas después de que Nano Banana Pro de Google generara un gran revuelo para sus resultados hiperrealistas, contribuyendo al aumento de Gemini de 450 millones a 650 millones de usuarios entre julio y octubre. Según se informa, el CEO de OpenAI, Sam Altman, declaró un "código rojo" en un memorando interno el mes pasado, acelerando el lanzamiento del modelo de imagen desde su debut previsto en enero.
Para los usuarios empresariales, la versión API ofrece entradas y salidas de imágenes un 20 % más baratas en comparación con GPT Image 1, con una mejor preservación del logotipo para aplicaciones de marketing y comercio electrónico. Empresas como Wix, Canva y Figma ya están probando el nuevo modelo.
OpenAI enfatizó que esto representa un progreso temprano en las capacidades de generación de imágenes, con actualizaciones futuras que prometen "ediciones de grano más fino a resultados más ricos y detallados en todos los idiomas".
El fin del Artículo