Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
CFD
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 40+ model AI, dengan 0% biaya tambahan
METR memperbarui standar kemampuan agen AI, Gemini 3.1Pro keandalan melebihi semua model terdepan dan menduduki puncak
ME News Berita, 16 April (UTC+8), menurut pemantauan Beating dari Dongcha, lembaga penilaian keamanan AI METR memperbarui standar “Garis Waktu” (Time Horizon), menambahkan data pengujian Google Gemini 3.1 Pro. Standar ini melacak batas kemampuan agen AI terdepan dalam menyelesaikan tugas pemrograman secara mandiri, dan sejak diluncurkan pada Februari tahun ini telah menjadi referensi penting dalam mengukur pertumbuhan kemampuan agen AI.
Metode pengukuran adalah dengan meminta ahli rekayasa perangkat lunak manusia (rata-rata pengalaman sekitar 5 tahun) dan agen AI menyelesaikan lebih dari seratus tugas perangkat lunak yang sama, menggunakan waktu manusia sebagai ukuran tingkat kesulitan tugas.
Dua indikator utama adalah: Garis Waktu 50% (kemungkinan AI menyelesaikan tugas dengan tingkat kesulitan tertinggi dalam waktu tertentu) dan Garis Waktu 80% (kemungkinan AI menyelesaikan tugas dengan tingkat kesulitan tertinggi dalam waktu tertentu).
Gemini 3.1 Pro menunjukkan peringkat yang berbalik pada kedua indikator tersebut.
Garis Waktu 50% menempati posisi kedua, hanya di bawah Claude Opus 4.6 yang sangat unggul:
Namun, pada Garis Waktu 80% yang lebih ketat, Gemini 3.1 Pro melampaui dan menduduki puncak:
Claude Opus 4.6 mampu menantang tugas yang lebih sulit tetapi tingkat keberhasilannya fluktuatif, sementara Gemini 3.1 Pro memiliki batas atas yang lebih rendah tetapi lebih stabil dalam kemampuan.
Dalam skenario produksi yang membutuhkan hasil yang dapat diprediksi, yang terakhir mungkin lebih praktis.
Dibandingkan dengan generasi sebelumnya, Gemini 3 Pro (Garis Waktu 50% sekitar 3,7 jam), Gemini 3.1 Pro meningkat sekitar 71%.
Dari sudut pandang garis waktu yang lebih panjang, data METR menunjukkan bahwa garis waktu model terdepan meningkat dari beberapa detik GPT-2 pada 2019 menjadi lebih dari sepuluh jam saat ini, dengan perkiraan setiap 4,3 bulan mengalami penggandaan, dan METR menyatakan “tidak melihat tanda-tanda perlambatan pertumbuhan eksponensial”.
Perlu dicatat bahwa tugas METR mencakup rekayasa perangkat lunak, pembelajaran mesin, dan keamanan jaringan, semuanya merupakan tugas terpisah yang definisinya jelas dan dapat dinilai secara otomatis.
Dalam penelitian lanjutan, METR menemukan bahwa ketika metode penilaian diubah dari penilaian algoritma menjadi penilaian manusia secara keseluruhan, performa AI menurun secara signifikan.
Garis waktu 12 jam tidak berarti AI dapat menggantikan manusia selama setengah hari kerja.
(Sumber: BlockBeats)