DeepSeek V4 pertama kali memaparkan sandbox Agent tingkat produksi DSec: menjadwalkan ratusan ribu konkurensi dalam satu klaster, menyatukan empat basis heterogen.

ME News Pesan, 24 April (UTC+8), menurut pemantauan Beating, laporan teknis DeepSeek V4 untuk pertama kalinya mengungkap infrastruktur inti yang mendukung pelatihan agen dan evaluasi skala besar, yaitu sandbox komputasi elastis tingkat produksi DSec (DeepSeek Elastic Compute).
Saat ini, pembelajaran penguatan model besar membutuhkan lingkungan uji coba kode yang sangat besar. Laporan mengungkapkan, dalam produksi aktual, satu cluster DSec dapat menjadwalkan puluhan ribu sandbox bersamaan. Sistem ini ditulis dalam Rust, dan terhubung ke sistem file terdistribusi 3FS buatan sendiri di lapisan bawah, yang memecahkan hambatan kinerja cold start sandbox besar melalui pemuatan sesuai permintaan (on-demand loading) bertingkat.
Dalam pengalaman pengembang, DSec menggunakan satu set Python SDK untuk menyatukan empat basis eksekusi: panggilan fungsi, kontainer, mesin virtual mini, dan mesin virtual lengkap, yang hanya perlu mengubah satu parameter saat beralih. Untuk masalah umum preemption tugas di cluster komputasi, DSec memperkenalkan log lintasan global: ketika tugas dipulihkan, sistem akan langsung "mempercepat" memutar ulang hasil eksekusi perintah yang sudah di-cache, sehingga memungkinkan pelatihan lanjutan titik putus yang sangat cepat, dan menghindari kesalahan non-idempoten karena eksekusi berulang.
(Sumber: BlockBeats)
DEEPSEEK-3,20%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan