Standar penilaian terbuka + juri yang seragam, T2I akhirnya memiliki sistem penilaian yang kompetitif, tingkat keaslian dan kreativitas masih menjadi pembeda utama.

Lihat Asli
BlockBeatNews
Pengujian T2I Alibaba Qwen-Image-Bench terbuka, GPT Image 2 meraih juara dan unggul dalam lima kategori
Tim Qwen dari Alibaba membuka sumber standar evaluasi gambar Qwen-Image-Bench dan wasit visual terpadu Q-Judger, digunakan untuk menilai kemampuan teks ke gambar (T2I). Meliputi lima dimensi kualitas gambar, estetika, kesesuaian gambar, keaslian, dan kreativitas, dengan 23 sub-kemampuan dan 56 indikator; termasuk 1000 kata petunjuk bilingual Cina-Inggris. 80 pengulas profesional melakukan penilaian buta, data lebih dari 130.000 pasangan anotasi, tingkat kesesuaian penilaian antara wasit dan manusia mencapai 92%. Dari 18 model pertama, GPT Image 2 menempati posisi teratas, model terbaik masih menunjukkan jarak yang signifikan dalam dimensi keaslian dan kreativitas, detail seperti ilustrator, gravitasi, cahaya dan bayangan masih menjadi hambatan umum.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan