美团 проводит открытое тестирование крупномасштабной модели с триллионами параметров, обучение которой полностью выполнено на кластере отечественных вычислительных мощностей.

robot
Генерация тезисов в процессе
AIMPACT сообщение, 24 апреля (UTC+8), по информации из отрасли, новое поколение базовой большой модели Meituan LongCat-2.0-Preview уже открыто для тестирования. Общее количество параметров этой модели превышает триллион, по масштабу она входит в число ведущих мировых больших моделей. По словам информированных источников, новая большая модель V4, выпущенная DeepSeek в тот же день, имеет практически одинаковое общее количество параметров и количество активированных параметров с Meituan LongCat-2.0-Preview. Помимо масштаба параметров, более значительный прорыв новой базовой большой модели Meituan заключается в том, что весь процесс обучения и вывода выполняется с использованием отечественного вычислительного кластера. Как сообщил вышеупомянутый источник, количество вычислительных карт, задействованных на этапе обучения Meituan, составляет от 50 000 до 60 000, что является крупнейшей на сегодняшний день задачей обучения большой модели, выполненной на отечественных вычислительных мощностях. (Интерфейс) (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено