Xiaomi и MiniMax одновременно наносят удар, война ценообразования Agent официально началась

robot
Генерация тезисов в процессе

18 и 19 марта две китайские компании последовательно выпустили свои крупные модели в направлении Agent. Внутренний стартап AI MiniMax представил M2.7, а команда крупной модели Xiaomi — V2-Pro. Обе модели заняли первые места в глобальном рейтинге Agent benchmark, но их цены на API-выводы составляют соответственно 1/21 и 1/8 от Claude Opus 4.6.

Объявления обеих компаний вышли в одну неделю, но их подходы кардинально различны. Они представляют два совершенно разных технологических пути, делая ставку на два будущих сценария эпохи Agent.

Один экзамен, одна плата 1/17

Рассмотрим наиболее очевидное сравнение.

По данным OpenRouter и официальных страниц цен компаний, цена API-вывода (за миллион токенов) составляет 1,2 доллара для MiniMax M2.7 и 3 доллара для MiMo-V2-Pro. В качестве сравнения, цена Claude Opus 4.6 — 25 долларов, GPT-5.2 — 14 долларов, Claude Sonnet 4.6 — 15 долларов.

Разница в ценах — порядка величин, но разница в возможностях — нет. На SWE-bench Verified (наиболее популярный benchmark для оценки кодовых навыков) MiMo-V2-Pro набирает 78%, Sonnet 4.6 — 79.6%, разница менее двух процентов. M2.7 показывает 56.22% на SWE-Pro, что сопоставимо с GPT-5.3-Codex. В VIBE-Pro (оценка способности к комплексной сдаче проектов) M2.7 достигает 55.6%, приближаясь к уровню Opus 4.6.

Главное в этой диаграмме — не кто выше или ниже — системы benchmark не полностью совпадают, сравнивать напрямую нужно с осторожностью. Важен «ценовой-качественный разрыв»: отечественные модели Agent уже попали в один диапазон возможностей, но при совершенно разных ценовых сегментах.

Триллион параметров против самоэволюции

Цена — лишь внешний аспект. Обе компании используют совершенно разные подходы.

MiMo-V2-Pro идет по пути «большой силы — большие чудеса». Согласно официальному объявлению Xiaomi, V2-Pro содержит более триллиона параметров, активных 42 миллиарда, поддерживает сверхдлинный контекст до 1 миллиона токенов. Основное нововведение — гибридная механика внимания (Hybrid Attention), сочетающая скользящее окно внимания (SWA) и глобальное внимание (GA) в соотношении 7:1 — предшественник V2-Flash использовал соотношение 5:1. Эта архитектура обеспечивает большую стабильность при обработке длинных документов и параллельных вызовах инструментов в сценариях Agent. В PinchBench (оценка возможностей вызова инструментов) MiMo-V2-Pro набирает 84%.

M2.7 идет по совершенно иному пути. Согласно официальному блогу MiniMax от 18 марта, точное число параметров M2.7 не раскрывается, но демонстрируется механизм «самоэволюции»: модель самостоятельно запускает более 100 циклов оптимизации, включая анализ неудачных траекторий, планирование изменений, модификацию собственной архитектуры, оценку, повтор. В результате внутренней оценки достигнуто 30% повышение производительности. В 22 сложных задачах MLE Bench Lite (оценка сложности машинного обучения) модель получила 9 золотых, 5 серебряных и 1 бронзовую медаль, средний уровень наград — 66.6%.

По пяти направлениям обе модели демонстрируют кардинально разные преимущества: MiMo-V2-Pro явно превосходит по длине контекста и по кодовой инженерии, M2.7 — по автоматизации работы и возможностям самоэволюции. Согласно тому же техническому блогу MiniMax, M2.7 набирает 1495 по оценке GDPval-AA (оценка обработки офисных документов), что делает его лидером среди открытых моделей, а по более чем 40 сложным навыкам в тесте MM-Claw сохраняет 97% соответствия.

Пять месяцев — четыре версии

Обновления обеих компаний отличаются не только технологическими путями, но и ритмом.

По публичным данным, MiniMax с октября 2025 года по март 2026 года выпустила четыре версии M2, с интервалом примерно 49 дней. Между M2.5 и M2.7 — всего около 30 дней.

Ритм Xiaomi — иной: в апреле 2025 года вышла MiMo-7B (открытая модель с 7 миллиардами параметров), в декабре — V2-Flash (309 миллиардов), в марте 2026 — V2-Pro (1 триллион). Каждое поколение — значительный скачок по параметрам и архитектуре, но интервал между версиями — дольше.

MiniMax выбирает стратегию «малых шагов», каждое обновление — незначительное, но очень частое. Механизм самоэволюции M2.7 специально создан для «непрерывного развития». Xiaomi же делает ставку на мощные скачки — каждое обновление — крупное изменение по параметрам и архитектуре.

Аноним за 8 дней взошел на вершину OpenRouter

Помимо технологического подхода, стратегия публикаций Xiaomi также ломает отраслевые стереотипы.

По Reuters, 11 марта на крупнейшей платформе API-агрегаторе OpenRouter появился анонимный модель Hunter Alpha. Без бренда, без презентации, без технического блога. Цена API — очень низкая, а производительность — удивительно высокая.

Сообщество начало гадать о происхождении. Согласно Republic World и нескольким СМИ, наиболее вероятная версия — DeepSeek V4, поскольку руководитель команды MiMo, Ло Фули, ранее работал в DeepSeek. Внутренние вызовы быстро выросли — за период анонимности суммарный объем вызовов превысил 1 триллион токенов, заняв первое место в недельном рейтинге OpenRouter.

19 марта утром Xiaomi объявила: Hunter Alpha — это и есть MiMo-V2-Pro. По тому же Reuters, после объявления цена акций Xiaomi в Гонконге выросла до 5.8%.

Это первый случай, когда отечественная крупная модель на глобальной платформе доказала свои возможности полностью слепым тестом. Без бренда, без рекламы, за 8 дней разработчики проголосовали ногами.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено