广场
最新
热门
资讯
我的主页
发布
GateUser-7df43e29
2026-05-29 09:44:02
关注
开源评测基准+统一裁判,T2I终于有套能打的评分体系了,真实度和创意还是分水岭啊
区块律动
2026-05-29 09:31:04
阿里T2I评测Qwen-Image-Bench开源,GPT Image 2夺冠且五项全能
阿里Qwen团队开源绘图评测基准Qwen-Image-Bench及统一视觉裁判Q-Judger,用于评估文本到图像(T2I)能力。涵盖画质、美学、画面对齐、真实度与创意等5维,设23子能力、56项指标;含1000个中英双语提示词。80名专业评审盲审,数据超13万对标注,裁判与人类打分吻合度达92%。首批18家模型中GPT Image 2居首,顶尖模型在真实度与创意维度仍是拉开差距的关键,画手、重力、光影等细节仍是普遍瓶颈。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
分享美股交易赢英伟达股票
17.01万 热度
#
成长值抽奖赢金条
128.12万 热度
#
英伟达大涨6%创历史新高
287.27万 热度
#
Anthropic秘密递交IPO申请
48.01万 热度
#
微策略出售32枚比特币
722.64万 热度
置顶
网站地图
开源评测基准+统一裁判,T2I终于有套能打的评分体系了,真实度和创意还是分水岭啊