Открытые стандарты оценки + единая система судейства, T2I наконец-то получила рабочую систему оценки, настоящая реалистичность и креативность — это действительно разделяющая черта.

Посмотреть Оригинал
BlockBeatNews
Али T2I оценка Qwen-Image-Bench с открытым исходным кодом, GPT Image 2 занял первое место и показал универсальность во всех пяти категориях
Команда Alibaba Qwen выпустила открытый тестовый набор для оценки генерации изображений Qwen-Image-Bench и единый визуальный судья Q-Judger, предназначенные для оценки возможностей преобразования текста в изображение (T2I). Он охватывает пять аспектов: качество изображения, эстетика, соответствие изображению, реализм и креативность, включает 23 подспособности и 56 показателей; содержит 1000 двуязычных подсказок на китайском и английском языках. 80 профессиональных экспертов проводят слепое тестирование, более 130 тысяч аннотированных пар данных, согласованность оценок судьи и человека достигает 92%. В первых 18 моделях GPT Image 2 занимает первое место, а лучшие модели по-прежнему демонстрируют разрыв в аспектах реалистичности и креативности, детали такие как художник, гравитация, светотень остаются общими узкими местами.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено