Только что увидел, что DeepSeek-V4 стал открытым исходным кодом, обновление действительно впечатляет. Окно контекста в 1 МБ и алгоритм сжатия KV Cache явно повысили способность обрабатывать длинные последовательности. Но это также создает вызовы для инфраструктуры. Говорят, что решение DCS AI от Huawei уже полностью адаптировано, они используют преимущества своей аппаратно-программной полной цепочки для системных оптимизаций. Кажется, что решение DCS в плане требований к инфраструктуре для больших моделей выглядит интересно. Вы использовали решение DCS?

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить