DeepSeek V4 представляє пісочницю агентів виробничого рівня DSec: управління сотнями тисяч одночасних завдань у одному кластері

Згідно з моніторингом Dongcha Beating, технічний звіт для DeepSeek V4 публічно розкрив основну інфраструктуру, яка підтримує агентське пост-навчання та масові оцінки, виробничий еластичний обчислювальний пісочниця DSec (DeepSeek Elastic Compute). Наразі, навчання з підкріпленням великих моделей вимагає надзвичайно широкого середовища для випробувань і помилок коду. У звіті повідомляється, що в реальному виробництві один кластер DSec може одночасно керувати сотнями тисяч пісочниць. Система написана на Rust і інтерфейсує з саморозробленою розподіленою файловою системою 3FS, подолуючи вузьке місце продуктивності холодних запусків для масових пісочниць через ієрархічне завантаження за запитом. Що стосується досвіду розробника, DSec об’єднує чотири бази виконання — виклики функцій, контейнери, мікросистеми віртуальних машин і повні віртуальні машини — за допомогою одного SDK на Python, що вимагає лише зміни параметра для перемикання. Щоб вирішити поширену проблему попередження завдань у обчислювальних кластерах, DSec вводить глобальний журнал траєкторій: коли завдання відновлюється, система безпосередньо «пророкує» його для повторного відтворення кешованих результатів виконання команд, досягаючи швидкого продовження з перерви та уникаючи помилок, що виникають через повторне виконання, які не є ідемпотентними.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити