¡ChatGPT Imágenes 2.0 en lanzamiento! Afirmando que pensará, la renderización de texto evoluciona, prueba del efecto en el menú de fideos de carne

robot
Generación de resúmenes en curso

OpenAI lanza ChatGPT Images 2.0, una herramienta para imágenes generadas en vivo, que destaca por su potente capacidad de diseño complejo y manejo multilingüe (incluyendo chino). Este artículo presenta una revisión completa de las funciones, características, planes gratuitos y de pago, además de resultados de pruebas reales.

¿Qué es ChatGPT Images 2.0? ¡Te contamos sus funciones principales y características!

¿Ha llegado una herramienta de generación de imágenes AI comparable a Gemini Nano Banana 2? OpenAI anunció el lanzamiento de ChatGPT Images 2.0, impulsada por el nuevo modelo GPT Image 2, que se enfoca en la capacidad de seleccionar, ordenar y revelar información en las imágenes. Aquí están las 3 principales características de ChatGPT Images 2.0:

Potente manejo de diseño y textos multilingües

Una característica claramente destacada es la significativa mejora en la capacidad de diseño y manejo de textos en múltiples idiomas.

Medios como Techcrunch señalan que las herramientas anteriores de generación de imágenes AI generalmente usaban modelos de difusión, los cuales tenían dificultades para escribir textos con precisión. ChatGPT Images 2.0 puede representar con exactitud textos pequeños, iconos y detalles de interfaces de usuario.

OpenAI indica que Images 2.0 ha avanzado notablemente en el procesamiento de idiomas no latinos, incluyendo chino, japonés, coreano, hindi y bengalí, pudiendo generarlos con alta claridad en las imágenes.

Fuente: Ejemplo generado oficial de OpenAI ChatGPT Images 2.0

Capacidad de pensamiento y búsqueda en línea renovadas

Además de la capacidad de diseño y manejo multilingüe, ChatGPT Images 2.0 ofrece una nueva función de pensamiento, que permite buscar información en línea en tiempo real para ayudar en la generación de imágenes. El modelo tiene una base de conocimientos actualizada hasta diciembre de 2025, lo que ayuda a crear contenido relacionado con eventos recientes.

Fuente: Ejemplo generado oficial de OpenAI ChatGPT Images 2.0

Soporte para resolución 2K y relaciones de aspecto variadas

ChatGPT Images 2.0 soporta generación de imágenes en resolución hasta 2K y ofrece una gama más amplia de relaciones de aspecto, desde 3:1 en panorámico hasta 1:3 en vertical.

El responsable de investigación de OpenAI, Boyuan Chen, afirma que la arquitectura de Images 2.0 ha sido completamente rediseñada, siendo un modelo universal que, con simples indicaciones de texto, puede manejar cambios de perspectiva en estilo 3D y razonamiento espacial complejo.

Funciones para usuarios de planes gratuitos y de pago de ChatGPT Images 2.0

¿Vale la pena pagar? Los diferentes niveles de usuarios de ChatGPT Images 2.0 tienen distintas funciones desbloqueadas, resumidas así:

  • Usuarios gratuitos: Actualmente pueden usar el modelo básico ImageGen 2.0 para tareas estándar de generación de imágenes. La versión básica ya incluye muchas mejoras clave, como mejor cumplimiento de instrucciones, efectos de renderizado de texto más potentes, soporte multilingüe y más opciones de relaciones de aspecto.
  • Usuarios de ChatGPT Plus, Business y Enterprise: Estos usuarios de pago pueden activar el nuevo modo de pensamiento. En este modo, el generador de imágenes del chatbot usará búsquedas en línea, creará diagramas visuales a partir de archivos subidos y realizará razonamiento estructural antes de generar la imagen. Se pueden generar hasta 8 imágenes simultáneamente, asegurando coherencia en personajes, objetos y estilos en cada escena.
  • Usuarios Pro: Tendrán acceso a una versión avanzada del modelo ImageGen Pro. Aunque OpenAI aún no ha detallado exactamente las diferencias entre Pro y el modo de pensamiento, los usuarios empresariales pueden considerar el modo de pensamiento como una mejora funcional, útil para tareas que requieren hechos verificables, convertir documentos internos en diagramas explicativos o mantener coherencia visual en múltiples activos.
  • Desarrolladores API: Ahora pueden integrar el modelo gpt-image-2, soportando alta resolución y configuraciones flexibles de relaciones de aspecto.

Prueba real de ChatGPT Images 2.0: menús, revistas, gráficos explicativos

¿El rendimiento real de ChatGPT Images 2.0 cumple con la promoción de OpenAI? Hagamos una prueba.

Prueba del menú de un restaurante de carne de res

El editor de “Crypto City” probó la versión gratuita de ChatGPT, creando un menú de carne de res taiwanés con instrucciones simples: “Genera un menú con enfoque en carne de res taiwanesa, en chino tradicional, mostrando nombres, precios e imágenes de cada plato.”

Aquí los resultados:

Fuente: Generado por ChatGPT Images 2.0

En cuanto a lo que puede generar la versión gratuita, parece bastante decente. Sin embargo, al observar con más detalle, Images 2.0 aún comete errores en caracteres chinos tradicionales con trazos complejos, quizás la versión de pago ofrezca mejores resultados.

Además, los precios generados se acercan a los de Taipei para carne de res, e incluso permite una recarga gratis en el mismo pedido.

Pero si quieres imprimir el menú, lo ideal sería convertir las imágenes generadas a archivos vectoriales (como EPS, .ai de Adobe Illustrator, PDF) y usar colores CMYK, para una impresión óptima. Aunque las imprentas también aceptan JPG y PNG, si tienes altas exigencias de calidad, será más difícil ajustar la imagen a tus necesidades.

Prueba de portada de revista de tecnología

Luego, probamos la portada de una revista de ciencia ficción, en esta ocasión “Crypto City” para evaluar la capacidad de manejo de diseño complejo. La instrucción fue: “Genera una portada de revista de tecnología en chino tradicional, con el título ‘Crypto City’, tema ‘Intersección de Blockchain y AI’, que incluya título, número de volumen, código de barras y fecha de publicación en la parte superior, con texto claro y alineado profesionalmente.”

Aquí los resultados:

Fuente: Generado por ChatGPT Images 2.0

Este resultado es similar al anterior: parece bien a simple vista, pero al examinar en detalle, aún presenta errores en caracteres chinos con trazos complejos. La tipografía de la portada se asemeja mucho a la fuente “Jin Xuan” de Justfont, una tipografía taiwanesa, no está claro si tiene licencia.

Este tipo de dudas también surgieron cuando “Crypto City” lanzó Nano Banana Pro.

  • Artículo relacionado: Prueba de Nano Banana Pro: mejoraron los caracteres chinos, pero surgen dudas sobre derechos de autor en animaciones y tipografías

Prueba con gráficos explicativos en múltiples idiomas

“Crypto City” probó un gráfico de causa de un terremoto en chino tradicional, japonés y coreano, logrando una representación general en múltiples idiomas. En diseño, se usaron diferentes colores para distinguir los idiomas, aunque al observar en detalle, algunos caracteres chinos complejos, kanji o coreanos aún presentan cierta borrosidad.

Aquí los resultados:

Fuente: Generado por ChatGPT Images 2.0

Images 2.0 mantiene la coherencia de personajes y objetos, resolviendo procesos complicados

Además, Images 2.0, al igual que Nano Banana 2, tiene capacidad de edición. Solo hay que hacer clic en “Editar” en la esquina inferior izquierda de la imagen generada para comenzar a modificar, manteniendo la coherencia de personajes y objetos, facilitando la creación de páginas de cómics, series de imágenes para redes sociales o planos de diseño de habitaciones en viviendas.

Adele Li, responsable del producto ChatGPT Images, comenta que esta función resuelve el proceso tedioso de generar cada imagen por separado y ensamblarlas manualmente, permitiendo a los creadores diseñar fácilmente libros infantiles con identidad visual coherente o materiales de marketing de marca.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado