Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 30+ model AI, dengan 0% biaya tambahan
Metode pelatihan setelah pencarian agen terbuka Perplexity, berdasarkan model Qwen3.5 mengungguli GPT-5.4 dari segi akurasi dan biaya
Menurut pemantauan Beating Monitoring, tim penelitian Perplexity menerbitkan artikel teknis yang memaparkan proses pelatihan ulang agen pencarian web mereka. Proses ini didasarkan pada model sumber terbuka Qwen3.5-122B-A10B dan Qwen3.5-397B-A17B, menggunakan skema dua tahap: pertama melakukan penyetelan halus pengawasan (SFT) untuk membangun perilaku wajib seperti mengikuti instruksi dan konsistensi bahasa, kemudian menggunakan pembelajaran penguatan strategi daring (RL) untuk mengoptimalkan akurasi pencarian dan efisiensi penggunaan alat.
Tahap RL menggunakan algoritma GRPO, dengan data pelatihan terdiri dari dua bagian: pertama, dataset tanya jawab verifikasi multi-langkah sintetis yang dikembangkan sendiri, dimulai dari query benih internal, membangun pertanyaan yang memerlukan inferensi 2 hingga 4 langkah melalui rantai entitas, dan diverifikasi keunikannya oleh beberapa solver independen; kedua, data dialog umum berbasis standar penilaian (rubric), mengubah persyaratan deployment seperti mengikuti instruksi dan batasan format menjadi kondisi atom yang dapat diperiksa secara objektif, digunakan selama tahap RL untuk mencegah degradasi perilaku yang dibangun melalui SFT.
Inti dari desain hadiah adalah penggabungan terkendali: hanya ketika baseline benar (pertanyaan dan jawaban atau semua standar penilaian terpenuhi), skor preferensi akan ikut dihitung, mencegah sinyal preferensi tinggi menutupi kesalahan faktual. Penalti efisiensi menggunakan metode penetapan jangkar dalam grup, dengan jawaban benar dalam grup sebagai patokan, memberikan penalti halus terhadap jumlah panggilan alat dan panjang keluaran yang berlebihan.
Pengujian menunjukkan bahwa Qwen3.5-397B-SFT-RL pasca pelatihan menunjukkan performa terbaik di berbagai tolok ukur pencarian. Di FRAMES, panggilan alat tunggal mencapai 57,3%, lebih tinggi 5,7 poin persen dari GPT-5.4 dan 4,7 poin persen dari Sonnet 4.6. Dengan anggaran sedang (4 panggilan alat), mencapai 73,9%, dengan biaya per query sebesar 2,0 sen dolar AS; dalam kondisi yang sama, GPT-5.4 mencapai 67,8% / 8,5 sen dolar, dan Sonnet 4.6 mencapai 62,4% / 15,3 sen dolar. Data biaya dihitung berdasarkan harga API yang diumumkan masing-masing vendor, belum termasuk optimisasi cache.