Pengujian standar tugas jangka panjang berbasis riwayat penelusuran nyata dirilis

AIMPACT Pesan, 30 April (UTC+8), Dan Fried mengumumkan di platform X bahwa timnya telah membangun sebuah pengujian dasar berbasis riwayat penelusuran pengguna nyata, yang mencakup sekitar 200 tugas multi-situs, bertujuan untuk mengevaluasi tingkat keberhasilan dan efisiensi agen dalam tugas jangka panjang (banyak di antaranya memerlukan penyelesaian selama berjam-jam). Makalah terkait telah diterbitkan, dipimpin oleh Lawrence K. dan lainnya. Pekerjaan ini berfokus pada penilaian kinerja agen dalam tugas web yang kompleks dan berlangsung dalam jangka waktu yang panjang. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan