Sonnet dan Opus, pasangan penasihat meningkatkan tingkat keberhasilan tugas agen cerdas

robot
Pembuatan abstrak sedang berlangsung

ME News Berita, 12 April (UTC+8), Baru-baru ini, sebuah pengujian tentang kinerja agen AI menunjukkan bahwa dalam tugas pencarian agen (BrowseComp), memadukan model Sonnet dengan konsultan Opus dapat meningkatkan tingkat keberhasilan tugas dari 58,1% menjadi 60,4%. Dalam tugas pengkodean terminal agen (Terminal-Bench 2.0), kinerjanya melonjak dari 59,6% menjadi 63,4%. Pendapat dalam artikel menyatakan bahwa ini mungkin karena Opus menyediakan perencanaan strategi yang sangat akurat untuk tugas-tugas yang sulit. (Sumber: InFoQ)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan