BlockchainDiary
vip

Saya percaya banyak teman yang telah mencoba menggunakan beberapa AI tetapi praktisnya terlalu terbatas bahkan terlihat tidak terlalu Satoshi.


Namun di pasar ada begitu banyak #AI, tetapi kurangnya sistem penilaian AI yang dapat dipercaya.

Jadi hari ini saya ingin berbagi dengan semua orang, apa perbedaan antara metode evaluasi AI tradisional dan kompetisi di blockchain @recall ➕ mekanisme reputasi AgentRank?

Metode penilaian tradisional 👇
1️⃣ Benchmark Kumpulan Pengujian Standar
Metode: Biarkan AI menjalankan kinerja pada tugas atau dataset standar
Skenario yang berlaku: pemahaman bahasa, pengenalan gambar, generasi kode, dll.

Kelebihan: cepat, seragam, mudah direproduksi, memudahkan pemilihan awal model

Kekurangan: mudah untuk memanipulasi peringkat, tidak dapat mensimulasikan kompleksitas tugas di dunia nyata, tidak dapat mengukur kemampuan beradaptasi dan stabilitas.

2️⃣ A/B testing
Cara: Meluncurkan berbagai versi Agent dalam penggunaan nyata oleh pengguna, mengamati perbedaan kinerjanya.

Keuntungan: Dekat dengan pengalaman pengguna yang sebenarnya, dapat mengukur dampak langsung terhadap bisnis.

Kekurangan: biaya tinggi, periode panjang, tidak transparan, sulit untuk direproduksi

3️⃣ Human-in-the-loop penilaian manusia
Cara: Biarkan penilai manusia memberikan skor pada keluaran AI, seperti pembuatan konten, layanan pelanggan, kreasi, dll.

Kelebihan: dapat menangani dimensi penilaian subjektif, dapat menemukan masalah detail

Kekurangan: biaya tenaga kerja tinggi, subjektivitas yang kuat, tidak dapat direplikasi dalam skala besar, hasil tidak dapat diverifikasi secara publik

4️⃣ AI Evaluasi AI (seperti GPT berperan sebagai Juri)

Cara: Menggunakan model bahasa besar untuk menilai output dari Agent lain
Skenario penggunaan, seperti soal kode, soal logika, dan penyaringan awal untuk pembuatan konten

Keuntungan: Cepat, otomatis

Kekurangan: Penilaian mungkin juga memiliki bias atau kesalahan, kurangnya konsensus komunitas dan mekanisme insentif, tidak memiliki verifikasi yang dapat dilakukan di blockchain.

✨Sementara @recallnet menggunakan kompetisi on-chain inovatif ➕ sistem reputasi dinamis #AgentRank, untuk menyaring AI

#Recall 设计了结构化和可定制的 # AI Arena, biarkan pintu AI memberikan hasil dalam tantangan nyata:
1) jika melakukan perdagangan nyata selama 7 hari di blockchain
2) berpartisipasi dalam kompetisi pembuatan artikel, pertempuran penciptaan gambar, analisis risiko kontrak, dan tugas lainnya.
3) semua data dan performa catatan di blockchain, terbuka dan transparan

AI yang menang akan mendapatkan hadiah dan #AgentRank yang lebih tinggi (semakin tinggi peringkatnya, semakin besar kepercayaan dan fungsinya).

Dibandingkan dengan metode penyaringan AI tradisional, #Recall menawarkan sistem penilaian yang lebih terbuka, dinamis, dan didorong oleh dunia nyata, di mana:👇
1.Kinerja kekuatan keras: tingkat penyelesaian tugas, akurasi, tingkat pengembalian, stabilitas, dll.
2.Dukungan komunitas: Pengguna dapat mempertaruhkan $RECALL untuk mendukung AI tertentu
3. Dapat diaudit sistem: Semua logika dan proses penalaran dapat dilacak, seperti Chain-of-Thought

Akhirnya, ini membentuk sistem peringkat AgentRank yang dinamis, yang memungkinkan Agen yang benar-benar kuat menonjol.

Catatan: Dari 8 Juli hingga 15 Juli akan ada kompetisi perdagangan AI selama 7 hari, teman-teman yang tertarik dapat ikut serta!

Detail:

#SNAPS # Ingat #Ai # Cookie @cookiedotfun @cookiedotfuncn
Lihat Asli
post-image
post-image
post-image
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)