Zhiyuan FlagOS завершила адаптацию восьми чипов DeepSeek-V4 Day0, охватывая Ascend, Hygon, Mooresville и другие.

robot
Генерация тезисов в процессе

Сегодня, DeepSeek выпустила флагманскую модель DeepSeek-V4-Pro 1.6T (1,86 трлн параметров) и эффективную модель DeepSeek-V4-Flash 284B (284 млрд). Ведущая исследовательская институция Zhiyuan Research Institute во главе с FlagOS первой адаптировала обе “гигантские” модели полностью, завершив полную адаптацию и развертывание inference для DeepSeek-V4-Flash на более чем 8 моделях AI-чипов, включая Hai Guang, Mu Xi, Huawei Ascend, Moore Thread (FP8), Kunlun Chip, Pingtouge Zhenwu, TianShu, Nvidia (FP8) и другие чипы. FlagOS также продвигает перенос адаптации модели DeepSeek-V4-Pro на несколько чипов, и в ближайшее время планируется открытие исходного кода. (Daily Science and Technology Board Daily)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить