Щойно побачив, що DeepSeek-V4 відкритий код, ця оновлення дійсно вражає. 1МБ контекстного вікна разом з алгоритмом стиснення KV Cache значно покращили здатність обробляти довгі послідовності. Однак це також створює виклики для інфраструктури. Чув, що рішення Huawei DCS AI вже повністю адаптоване, вони використовують власні апаратні та програмні рішення для системної оптимізації. Відчувається, що ця система DCS має цікаві можливості для задоволення потреб у інфраструктурі для великих моделей. Ви користувалися рішенням DCS?

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити