Berita dari Coinjie Wang, Anthropic merilis BioMysteryBench, sebuah rangkaian penilaian standar bioinformatika yang berisi 99 soal.


Soal-soal disusun oleh ahli bidang berdasarkan dataset nyata (sekuensing DNA/RNA, genomik protein, metabolomik, dll.),
jawaban berasal dari atribut objektif data atau metadata yang diverifikasi melalui eksperimen, tanpa bergantung pada penilaian subjektif peneliti.
Dalam penilaian, Claude Mythos mencapai tingkat penyelesaian 30% pada 23 soal sulit terkait manusia.
Lingkungan penilaian menyediakan wadah untuk Claude, yang sudah dipasang alat bioinformatika umum, dan dapat mengakses database publik untuk mengunduh genom referensi.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan