Model baru dari Anthropic menggandakan Opus 4.6 pada satu tolok ukur


Pratinjau Claude Mythos — undangan saja, tidak ada API publik. Angka-angka dari Sistem Kartu mereka:
- SWE-bench Verified: 93.9% vs 80.8% (Opus) vs 79.6% (Sonnet)
- SWE-bench Pro: 77.8% vs 53.4%
- Terminal-Bench 2.0: 82.0% vs 65.4%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan