2026-04-08 14:32:30

Model baru dari Anthropic menggandakan Opus 4.6 pada satu tolok ukur

Pratinjau Claude Mythos — undangan saja, tidak ada API publik. Angka-angka dari Sistem Kartu mereka:
- SWE-bench Verified: 93.9% vs 80.8% (Opus) vs 79.6% (Sonnet)
- SWE-bench Pro: 77.8% vs 53.4%
- Terminal-Bench 2.0: 82.0% vs 65.4%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.