Nuevo modelo de Image 2.0 de ChatGPT
El nuevo modelo de imagen por IA de OpenAI no es un proyecto secundario, es la apuesta de la compañía por el aspecto creativo de su futuro como superaplicación.
Por: Sandra Petrucci Lic. Sistemas / Locutora Integral
Mucho ha cambiado en la industria de la IA en los cuatro meses transcurridos desde que OpenAI lanzó ChatGPT Images 1.5.
Ahora, OpenAI regresa al mundo de los medios generativos. La compañía anunció el martes el lanzamiento de ChatGPT Images 2, su modelo de imágenes de próxima generación.
Puede parecer extraño que OpenAI lance un nuevo modelo de imagen apenas un mes después de anunciar el cierre de su aplicación de video Sora AI que, en su momento, se hizo viral, para centrarse en el desarrollo de “productos básicos” orientados a empresas.
Sin embargo, por la forma en que se construyó el nuevo modelo, queda claro que OpenAI no está dando marcha atrás en ese objetivo.
ChatGPT Images 2 está diseñado para producir imágenes con mucho texto, incluyendo infografías, pósteres científicos, guías de estudio y material de marketing.
Se terminaron los extraños videos de Sora y los memes inspirados en Studio Ghibli.
Ahora, la empresa está desarrollando una IA capaz de realizar lo que denomina “tareas creativas de valor económico”.
“El abanico de posibilidades y casos de uso de la inteligencia visual se amplía enormemente, y creemos que esto es fundamental para la visión de ChatGPT de desarrollar tu propio asistente personal, porque tu asistente creativo es una parte importantísima de quién eres como individuo”, declaró Adele Li, jefa de producto de ChatGPT Images, a los periodistas en una rueda de prensa.
OpenAI ha estado persiguiendo el sueño de una super aplicación, una plataforma integral para todo lo relacionado con la IA, basada en su plataforma Codex. ChatGPT Images 2 aporta la pieza creativa a ese proyecto.
El nuevo modelo mejora de forma natural la tipografía, la iconografía y la composición para producir imágenes de IA más profesionales. Puede generar texto en varios idiomas.

Los modelos de imágenes de IA han tenido dificultades, como es bien sabido, para crear texto legible y con información veraz. ChatGPT Images 2 es el mejor modelo de OpenAI hasta la fecha en este aspecto.
Google ya había mejorado la representación de texto con Nano Banana Pro, pero incluso ese modelo, considerado el mejor, tenía problemas de precisión.
ChatGPT Images 2 ya está disponible para todos los usuarios. El límite de generación depende de tu plan: cuanto más pagues, más imágenes con IA podrás generar.
Los desarrolladores que utilizan el modelo de la API pueden crear imágenes en resoluciones 2K y 4K, aunque estas resoluciones más altas aún están en fase beta y podrían presentar fallos.
Los usuarios de pago también pueden crear imágenes mediante modelos de razonamiento, que les ayudan a buscar información en la web, compilarla en un diseño legible y revisar su trabajo.
“Modelo de imagen” no parece el término más adecuado para ChatGPT Images 2, aunque técnicamente sea correcto. ChatGPT no captura el surrealismo fantástico de las imágenes generadas por IA como Midjourney, ni ofrece herramientas de edición ni remotamente parecidas a las de Adobe Firefly.
Pero está dirigido a un grupo de usuarios que se sitúa en un punto intermedio entre los aficionados al arte de Midjourney y los creadores profesionales de Adobe: aquellos que necesitan crear contenido atractivo.

Al igual que Claude Design, la herramienta recientemente lanzada por Anthropic , ChatGPT Images 2 de OpenAI está dirigida a profesionales.
Los docentes pueden usarla para crear guías de estudio y planes de lecciones ilustrados. Los responsables de marketing pueden crear publicaciones para redes sociales y recursos visuales.
Puedes crear hasta ocho imágenes a partir de una sola solicitud, como un informe de tres páginas, manteniendo la coherencia visual en todas ellas.