Tiêu chuẩn đánh giá mã nguồn mở + trọng tài thống nhất, T2I cuối cùng đã có một hệ thống đánh giá đủ sức cạnh tranh, độ chân thực và sáng tạo vẫn là ranh giới phân chia rõ ràng

Xem bản gốc
BlockBeatNews
Đánh giá T2I của Alibaba, Qwen-Image-Bench mã nguồn mở, GPT Image 2 giành chiến thắng và đạt thành tích toàn diện năm mục
Nhóm Qwen của Alibaba đã mở mã chuẩn đánh giá vẽ tranh Qwen-Image-Bench và trọng tài thị giác thống nhất Q-Judger, dùng để đánh giá khả năng chuyển đổi văn bản thành hình ảnh (T2I). Bao gồm năm chiều: chất lượng hình ảnh, thẩm mỹ, sự phù hợp của hình ảnh, độ chân thực và sáng tạo, đặt ra 23 khả năng phụ và 56 chỉ số; có 1000 từ khóa gợi ý song ngữ Trung-Anh. 80 chuyên gia đánh giá độc lập, hơn 130.000 cặp dữ liệu đã được gắn nhãn, độ phù hợp giữa trọng tài và điểm số của con người đạt 92%. Trong 18 mô hình đầu tiên, GPT Image 2 đứng đầu, các mô hình hàng đầu vẫn còn khoảng cách rõ rệt về độ chân thực và sáng tạo, các chi tiết như họa sĩ vẽ, trọng lực, ánh sáng và bóng tối vẫn là những điểm yếu chung.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim