ChatGPT Images 2.0 представлен! Говорят, что он умеет думать, эволюция текстовой визуализации, реальный тест на эффект меню с говяжьей лапшой

robot
Генерация тезисов в процессе

OpenAI выпустила инструмент для генерации изображений ChatGPT Images 2.0, ориентированный на мощные возможности сложной верстки и обработки многоязычного текста (включая китайский), в этой статье будет подробно представлен функционал, особенности, бесплатные и платные планы, а также реальные примеры сгенерированных изображений.

Что такое ChatGPT Images 2.0? Расскажем о ключевых функциях и особенностях!

Появился ли AI-инструмент для генерации изображений, способный конкурировать с Gemini Nano Banana 2? OpenAI объявила о выпуске ChatGPT Images 2.0, основанного на новой модели GPT Image 2, которая делает акцент на отличной способности выбора, расположения и раскрытия информации в изображениях. Ниже три основные особенности ChatGPT Images 2.0:

Мощная верстка и обработка многоязычного текста

Первое и очевидное отличие — значительно улучшенные возможности верстки и обработки многоязычного текста.

Издание Techcrunch отмечает, что ранее большинство инструментов для генерации изображений на базе AI использовали диффузионные модели, часто сталкиваясь с трудностями при написании текста. ChatGPT Images 2.0 может точно отображать мелкий текст, иконки и элементы пользовательского интерфейса.

OpenAI заявляет, что Images 2.0 достигла значительного прогресса в обработке языков, отличных от латинского алфавита, таких как китайский, японский, корейский, хинди и бенгальский, — все они могут быть сгенерированы с высокой четкостью внутри изображений.

Источник: Официальный пример генерации ChatGPT Images 2.0 от OpenAI

Новые возможности мышления и поиск в сети

Помимо верстки и обработки многоязычного текста, ChatGPT Images 2.0 предлагает новые функции мышления, позволяющие осуществлять поиск информации в интернете в реальном времени для помощи в создании изображений. Модель обновлена по состоянию на декабрь 2025 года, что помогает генерировать контент, связанный с недавними событиями.

Источник: Официальный пример генерации ChatGPT Images 2.0 от OpenAI

Поддержка разрешения 2K и разнообразных соотношений сторон

ChatGPT Images 2.0 поддерживает создание изображений с разрешением до 2K и предлагает широкий выбор соотношений сторон — от широкоформатных 3:1 до длинноформатных 1:3.

Руководитель исследований OpenAI Боюань Чен (Boyuan Chen) отметил, что архитектура Images 2.0 полностью переработана, она является универсальной моделью, которая с помощью простых текстовых подсказок способна выполнять преобразование перспективы в 3D-стиле и сложное пространственное рассуждение.

Функции бесплатных и платных планов ChatGPT Images 2.0

Платишь — получаешь? У пользователей с разными уровнями платных подписок есть разные возможности, их кратко перечислим:

  • Бесплатные пользователи: В настоящее время могут использовать базовую модель ImageGen 2.0 для стандартных задач генерации изображений. В базовую версию уже включены ключевые улучшения, такие как лучшее соблюдение команд, более мощная рендеринг текста, поддержка многоязычного текста и расширенные варианты соотношений сторон.
  • Пользователи ChatGPT Plus, Business и Enterprise: Эти платные подписки позволяют активировать новую модель мышления. В этом режиме генератор изображений использует поиск в интернете, создает визуальные объяснения на основе загруженных файлов и предварительно выполняет структурное рассуждение перед созданием изображений. Одновременно можно сгенерировать до 8 изображений, при этом сохраняется согласованность персонажей, объектов и стилей в сценах.
  • Пользователи Pro: Получают расширенный доступ к модели ImageGen Pro. Хотя OpenAI пока не раскрывает точные различия между Pro и функцией мышления, корпоративные клиенты могут считать функцию мышления как существенное обновление, полезное для задач, требующих фактических данных, преобразования внутренних документов в объяснительные графики или поддержания визуальной согласованности при работе с множеством активов.
  • Разработчики API: Теперь можно интегрировать модель gpt-image-2, которая поддерживает высокое разрешение и гибкие настройки соотношения сторон.

Реальные тесты ChatGPT Images 2.0: меню, журналы, диаграммы и объяснения

Как показывает практика, соответствует ли реальное качество ChatGPT Images 2.0 заявленным возможностям? Проведем тесты.

Тест меню ресторана с говядиной

Редакция «Крипто Город» протестировала бесплатную версию ChatGPT, создав меню тайваньских блюд из говядины. В подсказке было указано: «Пожалуйста, сгенерируйте меню с тайваньской говядиной, на котором будет традиционный китайский текст, отображающий название каждого блюда, цену и изображение.»

Вот результат:

Источник: Генерация ChatGPT Images 2.0

По содержанию, сгенерированному на бесплатной версии, выглядит неплохо, однако при внимательном рассмотрении видно, что при обработке сложных штрихов традиционных китайских иероглифов все еще бывают ошибки в написании, возможно, платная версия даст лучший результат.

Также результат примерно соответствует ценам на говядину в Тайбэе, и есть возможность бесплатного добавления лапши при заказе на вынос.

Если же планируется печать меню, то лучше преобразовать полученные изображения в векторные файлы (например, EPS, .ai или PDF) и использовать цветовую модель CMYK — это наиболее подходящий вариант для печати. Хотя типографии могут принимать JPG и PNG, при высоких требованиях к качеству лучше использовать векторные форматы для точной настройки.

Тест обложки научного журнала

Далее протестируем создание обложки научного журнала в стиле научной фантастики. В подсказке было: «Пожалуйста, сгенерируйте обложку технологического журнала на традиционном китайском языке, название журнала — «Крипто Город», тема — «Слияние блокчейна и AI». Обложка должна содержать заголовок, номер выпуска, дату, отображенную в верхней части штрих-кода, все надписи должны быть четкими и профессионально выровненными.»

Вот результат:

Источник: Генерация ChatGPT Images 2.0

Этот результат похож на предыдущий: на первый взгляд выглядит хорошо, но при внимательном рассмотрении при обработке сложных штрихов китайских иероглифов все еще есть недочеты. Шрифт на обложке очень похож на «JinSuanTi» от тайваньской компании Justfont, интересно, есть ли у них лицензия.

Подобные сомнения возникали и у «Крипто Город» при запуске Nano Banana Pro.

  • Соответствующая статья: Nano Banana Pro тест: улучшение китайских символов! Но появились опасения по поводу авторских прав на анимацию и шрифты

Тест многоязычных объяснительных диаграмм

«Крипто Город» протестировал диаграмму причины землетрясения на традиционном китайском, японском и корейском языках. Сложные многоязычные тексты были в целом успешно сгенерированы. В верстке использовались разные цвета для разных языков, хотя при внимательном рассмотрении некоторые сложные китайские иероглифы и корейские символы оставались размытыми.

Вот результат:

Источник: Генерация ChatGPT Images 2.0

Images 2.0 сохраняет согласованность персонажей и объектов, решая сложные задачи

Кроме того, Images 2.0, как и Nano Banana 2, обладает возможностью редактирования: достаточно нажать «Редактировать» в левом нижнем углу сгенерированного изображения, чтобы начать работу. Это позволяет сохранять согласованность персонажей и объектов, что значительно облегчает создание комиксов, серии постов для соцсетей или дизайн планировок комнат в доме.

Руководитель продукта ChatGPT Images Адель Ли отметил, что эта функция решает проблему, когда раньше пользователи вынуждены были по отдельности создавать каждое изображение и вручную соединять их, что было очень трудоемко. Теперь создатели могут легко создавать серии изображений с одинаковым визуальным стилем, например, для детских книг или маркетинговых кампаний.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить