Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
CFD
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
CFD
Derivatif CFD Saham AS
Saham AS
Akses saham AS dan ETF yang nyata
Saham HK
Perdagangkan saham berkualitas yang terdaftar di Hong Kong
Saham Korea
SK Hynix
Perdagangkan Saham Korea Nyata dan Berinvestasi pada Aset Populer
Saham Futures
Leverage tinggi, perdagangan 24/7
Tokenized Stocks
Didukung oleh aset saham nyata
IPO Access
Buka akses penuh ke IPO saham global
GUSD
Mint GUSD untuk Imbal Hasil Treasury RWA
Aktivitas Saham
Perdagangkan Saham Populer dan Dapatkan Airdrop yang Melimpah
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
IPO Access
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
OpenAI merilis evaluasi monitorability rantai pemikiran open-source: Semakin panjang CoT, semakin transparan; RL tidak akan mengajarkan model untuk "menyembunyikan pikiran".
Paket ini digunakan untuk mengukur apakah model pemantauan dapat mendeteksi perilaku abnormal melalui rantai pemikiran (CoT, proses penalaran internal yang dihasilkan model sebelum menjawab) dari model penalaran, mencakup 13 evaluasi dan 24 lingkungan.
Evaluasi dibagi menjadi tiga prototipe: Intervention (tipe intervensi, apakah model pemantauan dapat mendeteksi perubahan perilaku setelah mengubah input model), Process (tipe proses, memverifikasi apakah langkah penalaran model nyata), Outcome-property (tipe properti hasil, memprediksi dari lintasan penalaran apakah output memiliki kecurangan imbalan atau pelanggaran keamanan).
Temuan inti makalah: memantau CoT lebih efektif daripada hanya memantau tindakan dan output akhir model; semakin panjang CoT, semakin tinggi kemampuan monitorabilitas; pelatihan RL tidak secara substansial mengurangi monitorabilitas bahkan pada skala mutakhir saat ini. Satu temuan praktis adalah, untuk model besar dengan daya penalaran rendah, dapat diganti dengan model yang lebih kecil tetapi memiliki daya penalaran lebih tinggi, mendapatkan monitorabilitas yang lebih tinggi sambil mencocokkan kemampuan, dengan biaya komputasi penalaran yang lebih mahal. Selain itu, meningkatkan daya komputasi penalaran model pengawasan yang lemah dapat meningkatkan efektivitasnya dalam memantau model yang kuat, dan membiarkan model pengawasan yang lemah melihat CoT tidak hanya meningkatkan monitorabilitas tetapi juga mempercepat tren perluasan ini.
Kartu sistem GPT-5.4 Thinking telah menggunakan rangkaian evaluasi ini. Hasil menunjukkan monitorabilitas CoT keseluruhan GPT-5.4 Thinking sedikit lebih rendah dari GPT-5 Thinking, tetapi tidak turun secara menyeluruh: dalam skenario agentic misalignment (ketidakselarasan agen) mendekati 100%, penurunan terutama terkonsentrasi pada skenario tertentu seperti kueri kesehatan yang kurang bukti, bias memori, dan tugas yang mustahil. Setelah menyelidiki, OpenAI menganggap bahwa sebagian regresi berasal dari keterbatasan evaluasi itu sendiri. Repositori secara bersamaan menghentikan dua evaluasi: Anti-Scheming dan Memory, karena ketidakcocokan antara pemantauan CoT umum dengan penilaian jawaban khusus tugas pada yang pertama, dan akurasi penilaian jawaban yang tidak memadai pada yang terakhir.
(Sumber: BlockBeats)