Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
CFD
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 40+ model AI, dengan 0% biaya tambahan
Anthropic merilis BioMysteryBench: soal biologi yang tidak bisa dijawab oleh 5 ahli, Claude Mythos dapat menyelesaikan 30%
Soal dibuat oleh ahli bidang berdasarkan dataset nyata (sekuensing DNA/RNA, proteomik, metabolomik, dll), jawaban berasal dari atribut objektif data atau metadata verifikasi eksperimen, tidak bergantung pada penilaian subjektif peneliti.
Contoh soal: menentukan gen yang dihapus dari kelompok eksperimen berdasarkan data RNA-seq, atau menebak hubungan orang tua-anak dari data sekuensing genom lengkap.
Lingkungan pengujian memberi Claude sebuah wadah, sudah terpasang alat bioinformatika umum, dapat menginstal perangkat lunak melalui pip dan conda, dapat mengakses database publik seperti NCBI, Ensembl untuk mengunduh genom referensi, hanya menilai jawaban akhir, tidak terbatas pada jalur analisis.
Dari 99 soal, 76 setidaknya ada satu ahli manusia yang menjawab benar (dapat dipecahkan manusia), sisanya 23 soal tidak terpecahkan oleh maksimal 5 ahli bidang (kesulitan manusia).
Pada soal yang dapat dipecahkan manusia, Claude Opus 4.6 memiliki akurasi 77,4%, Mythos Preview meningkat lebih jauh.
Pada 23 soal yang sulit bagi manusia, model Sonnet 4.6 dan yang lebih kuat sudah mampu memecahkan proporsi yang cukup besar, Mythos Preview mencapai 30%.
Analisis jejak menunjukkan Claude memiliki dua strategi utama: pertama, memanggil pengetahuan lintas makalah yang terinternalisasi dalam data pelatihan, langsung menyelesaikan inferensi yang biasanya membutuhkan meta-analisis manusia; kedua, saat tidak yakin, menjalankan berbagai metode analisis secara bersamaan, mengambil irisan dari beberapa rangka bukti.
Analisis keandalan mengungkapkan perbedaan halus: pada soal yang dapat dipecahkan manusia, 86% dari jawaban Opus 4.6 benar setidaknya 4 kali dari 5 percobaan, menunjukkan kestabilan; pada soal sulit manusia, rasio ini turun menjadi 44%, hampir setengah jawaban benar hanya dalam 1-2 dari 5 percobaan, lebih seperti keberuntungan yang melewati jalur inferensi tertentu.
Di balik perbedaan akurasi, perbedaan keandalan lebih mampu menunjukkan batas kemampuan.
Genentech dan Roche secara bersamaan merilis CompBioBench (100 soal biologi komputasi) dengan konsep desain serupa, Claude Opus 4.6 secara keseluruhan mencapai 81%, soal tersulit 69%, hasil ini saling menguatkan dengan kesimpulan BioMysteryBench.
(Sumber: BlockBeats)