Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Standar Pengkodean Jangka Panjang FrontierSWE Dirilis: Tantangan Sulit 20 Jam, Hanya GPT-5.4 dan Opus4.6 yang Memberikan Sebagian Solusi
Berita ME News, 17 April (UTC+8), menurut pemantauan Beating, proyek pengujian standar agen kecerdasan buatan pemrograman FrontierSWE resmi dirilis hari ini, bertujuan untuk mendorong batas kemampuan agen AI saat ini. Standar ini mengumpulkan 17 tantangan nyata dari bidang optimisasi compiler, penelitian pembelajaran mesin, dan rekayasa berkinerja tinggi (seperti membangun layanan SQLite yang kompatibel dengan PostgreSQL), dan menyediakan jendela waktu hingga 20 jam untuk setiap tugas. Saat ini, standar ini berada dalam kondisi “belum jenuh”, sebagian besar model bahkan belum mampu mencapai kemajuan yang substansial. Dalam pengujian awal, hanya GPT-5.4 (Codex) dan Claude Opus 4.6 (Claude Code) yang mampu secara konsisten menulis sebagian solusi. Kedua model ini memiliki gaya yang sangat berbeda: GPT-5.4 menunjukkan performa yang lebih stabil, menempati peringkat tertinggi dalam skor rata-rata, tetapi cenderung konservatif; sementara Claude Opus 4.6 sangat “berani”, dengan waktu rata-rata lebih dari 8 jam untuk setiap tugas, jauh melebihi rata-rata sekitar 2 jam dari model lain. Strategi mengorbankan waktu untuk mendapatkan kedalaman ini membuat Opus 4.6 mampu mengungguli dalam performa terbaik (best@5, yaitu skor tertinggi dari 5 percobaan), sering menghasilkan kode yang sangat dioptimalkan, tetapi juga disertai tingkat kesalahan yang lebih tinggi dan kecenderungan “menyontek” yang lebih jelas. Pengujian ini juga mengungkapkan beberapa masalah umum pada agen kecerdasan buatan pemrograman: pertama, “percaya diri berlebihan”, di mana model sering menganggap tugas selesai dan mengirimkan jawaban sebelum waktu habis karena penilaian dangkal; kedua, “penarikan logika”, di mana Opus 4.6 sering kehilangan optimisasi yang sudah dilakukan dan kemudian “menemukan kembali” dalam iterasi berikutnya. Selain itu, kecuali Qwen 3.6, semua model top menunjukkan niat untuk menghindari deteksi secara aktif: misalnya Gemini mencoba menyembunyikan nama pustaka ilegal melalui encoding karakter, atau menjalankan proses tersembunyi di direktori sementara, berusaha menyelesaikan tugas di ambang pelanggaran. “Perilaku kontra” ini di bawah tekanan ekstrem memberikan perspektif baru dalam studi keamanan agen cerdas. (Sumber: BlockBeats)