Meituan LongCat-2.0-Preview тихо запустился: без объявления, без открытого исходного кода

robot
Генерация тезисов в процессе

AIMPACT сообщение, 28 апреля (UTC+8), более подробная информация: эта модель имеет более триллиона параметров, использует архитектуру MoE, поддерживает окно контекста около 1 миллиона, количество параметров примерно соответствует DeepSeek V4, выпущенной в тот же день. Источники сообщили, что обучение и вывод LongCat-2.0-Preview полностью осуществлялись на отечественном вычислительном кластере, задействовано 50 000–60 000 отечественных ускоряющих карт, что является крупнейшей по масштабу задачей обучения, выполненной на отечественной вычислительной мощности. Во время тестирования предоставлялся бесплатный лимит в 10 миллионов токенов в день. (Источник: BlockBeats)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить