Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Launchpad
Jadi yang pertama untuk proyek token besar berikutnya
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Kinerja Model Teratas dalam Pengujian PinchBench: Gemini 3 Flash Memimpin dengan Tingkat Keberhasilan 95.1%
Odaily每日星报最新报道,Magma的CISO 23pads在社交媒体上做出了重要披露。此次广泛测试旨在评估最新AI模型的能力,结果显示不同语言模型在基于代理的任务中表现出多大的有效性。
OpenClaw代理任务中模型能力测试
PinchBench基准专门评估了OpenClaw代理场景中的各种模型。这一测试系统旨在理解哪些语言模型最适合处理复杂的基于代理的任务。测试结果对技术社区具有重要意义,因为它们反映了AI模型在实际应用中的表现。
顶级AI模型的成功率比较
在PinchBench的结果中,Gemini 3 Flash以95.1%的成功率位居所有模型之首。紧随其后的是minimax-m2.1,成功率为93.6%,第三名是kimi-k2.5,成功率为93.4%。Claude Sonnet 4.5表现出92.7%的效率,而GPT-4o的成功率为85.2%。
Gemini 3 Flash排名第一的重要性
Gemini 3 Flash以95.1%的成功率获得第一名,这是一个重要的成就,表明该模型非常适合基于代理的任务。此次测试结果清楚显示,不同模型的能力存在显著差异,组织应根据自身需求选择合适的模型。像PinchBench这样的基准测试正助力于做出这些关键决策。