OpenAI запускает модель ChatGPT Images 2.0, улучшая обработку сложных визуальных задач

22 апреля OpenAI запустила модель ChatGPT Images 2.0, значительно улучшившую способность выполнять сложные визуальные задачи, с обновлениями в понимании инструкций, размещении объектов и выражении связей, а также в рендеринге текста высокой плотности. Эта модель поддерживает мультиязычную генерацию текста, точно отображая нелатинский контент на изображениях и повышая общую семантическую согласованность. В плане возможностей генерации ChatGPT Images 2.0 позволяет более точно контролировать детали, включая мелкий шрифт, иконки, элементы интерфейса и сложные композиции, с максимальным разрешением вывода 2K. Кроме того, она дополнительно укрепила представление стилей и реализм, позволяя стабильно генерировать фотореалистичные изображения, киношные стили, пиксельное искусство и комиксы, что делает её подходящей для сценариев разработки игр, дизайна раскадровок и производства маркетинговых материалов. Она обладает возможностями обработки задач от начала до конца, выполняя весь рабочий процесс от генерации текста до композиции дизайна. ChatGPT Images 2.0 теперь доступна всем пользователям ChatGPT и Codex, а функция изображений с «мышлением» доступна пользователям Plus, Pro и Business (Поддержка предприятий скоро). Базовая модель, gpt-image-2, также доступна для интеграции через API.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить