Xiaomi MiMo-V2.5 серия с открытым исходным кодом: 1 триллион параметров по лицензии MIT, эффективность токенов превосходит GPT-5.4 на ClawEval

robot
Генерация тезисов в процессе

Согласно мониторингу Dongcha Beating, команда Xiaomi MiMo открыла исходный код серии крупных моделей MiMo-V2.5, которая включает две модели, обе под лицензией MIT, поддерживающие коммерческое развертывание, продолженное обучение и тонкую настройку, с окном контекста до 1 миллиона токенов. MiMo-V2.5-Pro — это чистая модель MoE (архитектура Смеси Экспертов) с общим количеством 1,02 триллиона параметров и 42 миллиарда активных параметров; MiMo-V2.5 — это нативная мультимодальная модель с общим количеством 310 миллиардов параметров и 15 миллиардами активных параметров, поддерживающая понимание текста, изображений, видео и аудио. MiMo-V2.5-Pro в первую очередь ориентирована на сложные задачи агента и программирования. В оценке ClawEval V2.5-Pro достигла 64% Pass^3, достигнув сопоставимых уровней при потреблении всего около 70 000 токенов на задачу, что примерно на 40% — 60% меньше, чем у Claude Opus 4.6, Gemini 3.1 Pro и GPT-5.4. Оценка SWE-bench Verified составляет 78,9. В кейсе, представленном на официальном блоге, V2.5-Pro самостоятельно реализовала полный компилятор SysY в RISC-V для проекта по принципам компиляторов в Пекинском университете, затратив 4,3 часа и 672 вызова инструментов, достигнув идеального результата 233/233 на скрытом тестовом наборе. MiMo-V2.5 предназначена для мультимодальных сценариев агента, оснащена выделенным визуальным энкодером (ViT с 729 миллионами параметров) и аудиоэнкодером (261 миллион параметров), набрав 62,3 балла в общем разделе Claw-Eval. Обе модели используют смешанную архитектуру скользящего внимания (SWA) и глобального внимания (GA), а также модуль предсказания нескольких токенов (MTP) из 3 слоёв (предсказывающий несколько токенов одновременно для ускорения вывода). Весовые параметры были опубликованы на Hugging Face. Вместе с открытым исходным кодом команда MiMo запустила программу «Orbit Trillion Token Creator Incentive Program», предлагающую в течение 30 дней глобальным пользователям бесплатный квотный лимит в 100 триллионов токенов. Индивидуальные разработчики, команды и предприятия могут подать заявку на странице мероприятия, с периодом оценки около 3 рабочих дней. После одобрения преимущества будут предоставлены в виде Token Plan или грантов, которые можно напрямую использовать с программными инструментами, такими как Claude Code и Cursor.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить