Référentiel d'évaluation open source + arbitre unifié, T2I dispose enfin d'un système de notation compétitif, la véracité et la créativité restent le seuil décisif.

Voir l'original
BlockBeatNews
Ali T2I évalue Qwen-Image-Bench en open source, GPT Image 2 remporte la victoire et excelle dans cinq catégories
L'équipe Qwen d'Alibaba a open source le benchmark d'évaluation de dessin Qwen-Image-Bench et le juge visuel unifié Q-Judger, utilisés pour évaluer la capacité de génération d'images à partir de texte (T2I). Il couvre cinq dimensions : qualité d'image, esthétique, alignement image-texte, réalisme et créativité, avec 23 sous-compétences et 56 indicateurs ; comprenant 1000 prompts bilingues chinois-anglais. Huitante évaluateurs professionnels en aveugle, avec plus de 130 000 annotations de données, la cohérence entre le jugement et la notation humaine atteint 92 %. Parmi les 18 premiers modèles, GPT Image 2 est en tête, et les modèles de pointe montrent que la différence en termes de réalisme et de créativité reste cruciale, tandis que les détails tels que le dessin, la gravité, la lumière et l'ombre restent des défis courants.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé