Как использовать ChatGPT Images 2.0? Практическое тестирование меню с говяжьей лапшой, обложек журналов, эффектов научных статей на нескольких языках

robot
Генерация тезисов в процессе

OpenAI выпустила инструмент для генерации изображений ChatGPT Images 2.0, ориентированный на мощные возможности сложной верстки и обработки многоязычного текста (включая китайский). В этой статье будет подробно представлен функционал, особенности, бесплатные и платные планы, а также реальные результаты генерации.

Что такое ChatGPT Images 2.0? Расскажем о ключевых функциях и особенностях!

Появился ли AI-инструмент для генерации изображений, способный конкурировать с Gemini Nano Banana 2? OpenAI объявила о запуске ChatGPT Images 2.0, основанного на новой модели GPT Image 2, которая делает акцент на отличной способности выбора, расположения и раскрытия информации в изображениях. Ниже — три основные особенности ChatGPT Images 2.0:

Мощная верстка и обработка многоязычного текста

Первое и очевидное отличие — значительно улучшенные возможности верстки и обработки многоязычного текста.

Издание Techcrunch отмечает, что ранее большинство инструментов для генерации изображений на базе ИИ использовали диффузионные модели, которые часто сталкивались с трудностями при написании текста. ChatGPT Images 2.0 способна точно отображать мелкий текст, иконки и элементы пользовательского интерфейса.

OpenAI заявляет, что Images 2.0 значительно продвинулась в обработке языков, не использующих латинский алфавит, таких как китайский, японский, корейский, хинди и бенгальский, — все они могут быть сгенерированы с высокой четкостью внутри изображений.

Источник: Примеры генерации на официальном сайте OpenAI ChatGPT Images 2.0

Новые возможности мышления и поиск в сети

Помимо верстки и обработки многоязычного текста, ChatGPT Images 2.0 предлагает новые возможности мышления, позволяющие использовать поиск в интернете для помощи в генерации изображений. Модель обновлена до декабря 2025 года, что помогает создавать контент, связанный с недавними событиями.

Источник: Примеры генерации на официальном сайте OpenAI ChatGPT Images 2.0

Поддержка разрешения 2K и разнообразных соотношений сторон

ChatGPT Images 2.0 поддерживает создание изображений с разрешением до 2K и предлагает широкий выбор соотношений сторон — от широкоформатных 3:1 до длинных 1:3.

Руководитель исследований OpenAI Чэнь Боюань (Boyuan Chen) отметил, что архитектура Images 2.0 полностью переработана, она является универсальной моделью, которая при помощи простых текстовых подсказок способна выполнять преобразование перспективы в 3D-стиле и сложное пространственное рассуждение.

Функции бесплатных и платных планов ChatGPT Images 2.0

Качество за деньги? Пользователи с разными уровнями подписки на ChatGPT Images 2.0 имеют доступ к разным функциям, что можно подытожить так:

  • Бесплатные пользователи: В настоящее время могут использовать базовую модель ImageGen 2.0 для стандартных задач по генерации изображений. Базовая версия уже включает множество ключевых обновлений, таких как улучшенное выполнение команд, более мощная рендеринг текста, поддержка многоязычности и расширенные варианты соотношений сторон.
  • Пользователи ChatGPT Plus, Business и Enterprise: Эти платные пользователи могут активировать новую модель мышления. В этом режиме генератор изображений использует поиск в сети, создает визуальные объяснения на основе загруженных файлов и предварительно выполняет структурное рассуждение перед созданием изображения. Одновременно можно сгенерировать до 8 изображений, при этом сохраняется согласованность персонажей, объектов и стилей в сценах.
  • Пользователи Pro: Получают расширенный доступ к модели ImageGen Pro. Хотя OpenAI пока не раскрывает точные различия между Pro и функцией мышления, корпоративные клиенты могут считать мышление существенным обновлением, подходящим для задач, требующих фактической точности, преобразования внутренних документов в объяснительные графики или поддержания визуальной согласованности в нескольких активов.
  • Разработчики API: Теперь можно интегрировать модель gpt-image-2, которая поддерживает высокое разрешение и гибкие настройки соотношения сторон.

Реальные тесты ChatGPT Images 2.0: меню, журналы, объяснительные графики и др.

Как показывает практика, соответствует ли реальное поведение ChatGPT Images 2.0 заявленным возможностям? Проведем тест.

Тест меню ресторана с говядиной

Редакция «Крипто Город» протестировала бесплатную версию ChatGPT, создав меню тайваньских блюд из говядины. В подсказке было указано: «Помоги мне сгенерировать меню с тайваньской говядиной, на котором будет традиционный китайский текст, отображающий название каждого блюда, цену и изображение.»

Вот результат:

Источник: Генерация ChatGPT Images 2.0

По содержанию, созданному на бесплатной версии, выглядит неплохо, однако при внимательном рассмотрении видно, что при обработке сложных штрихов традиционных китайских иероглифов все еще бывают ошибки в написании. Возможно, платная версия даст лучшие результаты.

Также результат приблизился к ценам на говядину в Тайбэе, и можно заказать бесплатную добавку лапши.

Если же планируется печать меню, то лучше всего преобразовать полученные изображения в векторные файлы (например, EPS, .ai или PDF в Adobe Illustrator) и использовать цветовую модель CMYK — это наиболее подходящий вариант для печати. Хотя типографии могут принять JPG или PNG, при высоких требованиях к качеству лучше подготовить файлы в векторе.

Тест обложки научного журнала

Далее — тестирование обложки научного журнала, в этот раз «Крипто Город» проверил сложную верстку. Подсказка: «Помоги мне сгенерировать обложку технологического журнала на традиционном китайском языке, название журнала — «Крипто Город», тема — «Пересечение блокчейна и ИИ». Обложка должна содержать заголовок, номер выпуска, дату срока действия, отображенную над штрихкодом, все надписи должны быть четкими и профессионально выровненными.»

Результат:

Источник: Генерация ChatGPT Images 2.0

Этот результат похож на предыдущий — на первый взгляд выглядит хорошо, но при внимательном рассмотрении при обработке сложных штрихов китайских иероглифов все еще есть недочеты. Также шрифт на обложке очень похож на шрифт «JinSuan» от тайваньской компании Justfont, интересно, есть ли у них лицензия.

Подобные сомнения возникали и у «Крипто Город» при запуске Nano Banana Pro.

  • **Соответствующая статья:**Тест Nano Banana Pro: улучшение китайских символов! Но появились опасения по поводу авторских прав на анимацию и шрифты

Тест многоязычных объяснительных графиков

«Крипто Город» протестировал график причины землетрясения на традиционном китайском, японском и корейском языках. Многоязычный текст был в целом успешно отображен. В верстке использовались разные цвета для разных языков, хотя при внимательном рассмотрении некоторые сложные китайские иероглифы и корейские символы оставались размытыми.

Результат:

Источник: Генерация ChatGPT Images 2.0

Images 2.0 сохраняет согласованность персонажей и объектов, решая сложные задачи

Кроме того, Images 2.0, как и Nano Banana 2, обладает возможностью редактирования: достаточно нажать «Редактировать» в левом нижнем углу сгенерированного изображения, чтобы начать работу. Это позволяет сохранять согласованность персонажей и объектов, что значительно облегчает создание комиксов, серии постов для соцсетей или дизайн планировок комнат в доме.

Руководитель продукта ChatGPT Images, Адель Ли, отметила, что эта функция решает проблему, когда пользователи раньше вынуждены были генерировать каждое изображение отдельно и вручную соединять их, а теперь создатели могут легко создавать серии изображений с одинаковым визуальным стилем, например, для детских книг или маркетинговых материалов бренда.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить