オープンソース評価基準+統一判定、T2Iにはついに戦える評価体系ができた。本物度と創造性はやはり分水嶺だね

原文表示
BlockBeatNews
阿里T2I評価Qwen-Image-Benchオープンソース、GPT Image 2が優勝し五つの項目で全能
アリQwenチームは、テキストから画像への能力を評価するためのオープンソースの画像生成評価基準Qwen-Image-Benchと、統一されたビジュアル判定基準Q-Judgerを開発しました。これらは、画質、美学、画像の整合性、リアリズム、創造性の5つの次元をカバーし、23のサブ能力と56の指標を設定しています。1000の中英二言語のプロンプトも含まれています。80名の専門評価者によるブラインド審査で、データは13万以上のラベル付けを超え、判定と人間のスコアの一致率は92%に達しています。最初の18モデルの中で、GPT Image 2がトップに立ち、最先端モデルでもリアリズムと創造性の次元で差をつけることが重要です。画風、重力、光と影などの細部は依然として一般的な課題です。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし