Quizás recuerdes cuando, hace unos meses, medio internet empezó a crear imágenes al estilo Studio Ghibli con ChatGPT para subirlas a las redes sociales. La “magia” detrás de esa fiebre fue el nuevo modelo de generación de imágenes de OpenAI. Pero todo va tan rápido que la conversación duró lo justo. Tiempo después, nuestra atención ya estaba en otra parte: en lo difícil que era distinguir algunas imágenes creadas con Nano Plátano Pro.
En muy poco tiempo, medio mundo empezó a hablar de las bondades del nuevo modelo generativo de Google, y fueron muchos los que lo situaron por delante del de OpenAI. Pero ésta es una carrera abierta, en la que los gigantes tecnológicos luchan por el liderazgo de la IA. Y, como era de esperar, la empresa dirigida por Sam Altman ha respondido. Este martes lanzó un nuevo ChatGPT Imágenesque viene con varias mejoras para los usuarios.
La edición como elemento clave. Uno de los grandes retos históricos de las herramientas de generación de imágenes ha sido la edición puntual de elementos concretos. El nuevo ChatGPT Images, impulsado por el modelo GPT Image 1.5, pretende directamente solucionar esta limitación, permitiéndonos modificar sólo lo que nos interesa, desde un objeto concreto hasta la iluminación, la composición o incluso la apariencia de las personas. Esto abre la puerta a combinar elementos o introducir cambios muy concretos sin tener que rehacer toda la imagen, algo que hasta ahora solía ser un punto débil en este tipo de modelos.
Cuatro veces más rápido. Con el modelo anterior, no era raro encontrar largos tiempos de espera hasta que se completara la imagen. En algunos casos, sobre todo en móviles, la generación incluso se detenía si cambiábamos de aplicación en mitad del proceso. Esta actualización promete imágenes hasta cuatro veces más rápidas. Y en nuestras pruebas hemos comprobado que el salto es real, con tiempos de generación sensiblemente más cortos y una experiencia mucho más fluida.
Algunos de los ejemplos compartidos por OpenAI, acompañados de la traducción del aviso al español.
«Paisaje en patineta de Los Ángeles, fotografiado en el siguiente estilo: fotografía callejera documental de finales de los 90, filmada con película en color de 35 mm, cámara telémetro estilo Leica M con lente de 35 mm, paleta de colores Kodak Portra 400, luz natural, contraste suave, colores realistas apagados, grano de película incrustado, ligera suavidad de los bordes, encuadre de observación espontánea, sin HDR, sin nitidez digital moderna, sin iluminación cinematográfica».
«Haz que su camiseta sea roja, su gorra amarilla, el límite de velocidad 15 y el camión un camión de bomberos».
«Combiné a los dos hombres y al perro en una fotografía estilo cine de los años 2000 de ellos luciendo aburridos en una fiesta de cumpleaños infantil».
Mírate en un anuncio o “viaja” a tu lugar favorito. Otro apartado donde ChatGPT Images da un salto es en las transformaciones creativas. Simplemente sube tu propia foto y acompáñala de un simple mensaje para obtener, en cuestión de segundos, resultados sorprendentemente convincentes. Vale aclarar que esta idea no es del todo nueva. De hecho, es una de las virtudes más destacadas de Nano Banana, un modelo que nuestro compañero Javier Lacort pudo probar a fondo y que ya apuntaba en esta dirección.
Veamos algunos ejemplos que creamos nosotros mismos con ChatGPT Images.
Imagen original:
«Crear una imagen de este hombre, pero en Time Square, en Nueva York, con ropa, looks, entorno, etc., que sean creíbles para el invierno de 2025».
«Situa a esta persona de cuerpo entero en una ciudad japonesa durante una noche lluviosa, con neón, reflejos en el suelo y estética cyberpunk.»
«Convierte a este hombre en un samurái japonés de cuerpo entero, con armadura y katanas tradicionales, en un escenario histórico realista, sin elementos modernos».
«Utilice la imagen de este hombre para crear un anuncio europeo de moras de los años 90. Representa al sujeto de cuerpo entero».
Precisión como bandera y mejoras en el texto.. OpenAI también pone énfasis en mejorar la precisión. ¿Cuántos de nosotros hemos tenido que pedir algo concreto y recibir justo lo contrario, o encontrarnos con que el modelo no ha entendido correctamente la instrucción? Parte de ese problema, según la empresa, debería dejarse atrás. Si proporcionamos instrucciones detalladas, el sistema debería poder respetarlas más fielmente. Además, se refuerza la generación de texto dentro de las imágenes, aspecto clave para la creación de carteles, anuncios promocionales y otros contenidos donde la tipografía y el mensaje son tan importantes como la propia imagen.
¿Adiós a las imágenes amarillentas? Durante mucho tiempo, una de las formas más sencillas de identificar si una imagen fue generada con ChatGPT era su estilo. Estas creaciones solían destacar por sus tonos cálidos, con un acabado cremoso y cierto predominio de los amarillos que acababan convirtiéndose en un signo reconocible. Sin embargo, todo indica que esta característica ha quedado atrás, salvo que se indique explícitamente en el aviso.
Lo vemos tanto en las imágenes que hemos generado como en la comparativa compartida por OpenAI, donde el nuevo resultado se aleja claramente de esa mirada tan característica de las primeras generaciones.
Dónde puedes utilizar las nuevas imágenes ChatGPT. OpenAI ha confirmado que el nuevo modelo de imágenes de ChatGPT se está implementando para todos los usuarios, incluidos aquellos que usan cuentas gratuitas. Si utilizas la aplicación móvil, es probable que ya la tengas activa. Lo notarás nada más abrir la aplicación, con un aviso que te invita a empezar a crear imágenes. Además, se ha añadido una nueva sección en la barra lateral, llamada Imágenes.
Lo más interesante de esta sección no es sólo que encontramos en un solo lugar todas las imágenes que hemos creado. Lo realmente útil es la cantidad de sugerencias disponibles para empezar a crear sin tener que pensar en un mensaje desde cero. Simplemente elige un estilo que te guste, sube una imagen o tómate un selfie y deja que el sistema haga el resto.
Imágenes | Abierto AI
En | Creíamos que Microsoft ya había puesto Copilot en todas partes. LG nos demuestra que estábamos muy equivocados