DeepSeek V4が初公開するプロダクションレベルのAgentサンドボックスDSec:単一クラスタで数十万の同時実行をスケジューリング、4種類の異種基盤を統一

ME News 報道、4月24日(UTC+8)、動察 Beating の監視によると、DeepSeek V4 技術報告は、Agent の後訓練と大規模評価を支えるコアインフラ、プロダクションレベルの弾性コンピューティングサンドボックス DSec(DeepSeek Elastic Compute)を初めて公開しました。 現在、大規模モデルの強化学習には極めて大規模なコード試行錯誤環境が必要です。報告書によると、実際の運用では、単一の DSec クラスターが数十万の同時サンドボックスをスケジュールできます。システムは Rust で記述され、基盤は自社開発の 3FS 分散ファイルシステムに接続されており、階層的なオンデマンドローディング(on-demand loading)により、大量のサンドボックスのコールドスタートのパフォーマンスボトルネックを打破しました。 開発者体験では、DSec は Python SDK を使用して、関数呼び出し、コンテナ、マイクロ仮想マシン、完全仮想マシンの4つの実行基盤を統一し、切り替え時には1つのパラメータを変更するだけで済みます。計算クラスターで一般的なタスクのプリエンプション問題に対し、DSec はグローバルトレースログを導入しました。タスクが復元されると、システムはキャッシュされたコマンド実行結果を直接「早送り」再生し、超高速のブレークポイント継続トレーニングを実現するとともに、繰り返し実行による非冪等エラーを回避します。 (出典:BlockBeats)
DEEPSEEK-2.53%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め