Xiaomi та MiniMax одночасно розгортають великі атаки, ціноутворюча війна Agent офіційно розпочалася

robot
Генерація анотацій у процесі

18 та 19 березня дві китайські компанії послідовно випустили свої великі моделі для агентів. Вітчизняна AI-стартап-компанія MiniMax представила M2.7, а команда великих моделей Xiaomi MiMo — V2-Pro. Обидві моделі увійшли до світового топу за показниками Agent benchmark, але їх ціноутворення API-інтерфейсів становить відповідно 1/21 і 1/8 від Claude Opus 4.6.

Обидві компанії випустили продукти в один тиждень, але їхні підходи кардинально різняться. Вони символізують два абсолютно різні технічні шляхи, що змагаються за майбутнє епохи агентів.

Одна й та сама іспит, плата 1/17

Розглянемо найпряміше порівняння.

За даними OpenRouter та офіційних цінових сторінок компаній, ціна API-інтерфейсу (за мільйон токенів) становить: MiniMax M2.7 — 1.2 долара, MiMo-V2-Pro — 3 долара. Для порівняння, ціна виводу Claude Opus 4.6 — 25 доларів, GPT-5.2 — 14 доларів, Claude Sonnet 4.6 — 15 доларів.

Різниця у ціні — кількісна, але різниця у можливостях — ні. На SWE-bench Verified (найпопулярніший benchmark для оцінки навичок у сфері кодування) MiMo-V2-Pro отримав 78%, Sonnet 4.6 — 79.6%, різниця менше двох відсотків. M2.7 має результат 56.22% у SWE-Pro, що відповідає GPT-5.3-Codex. У VIBE-Pro (оцінка здатності до повного виконання проектів) M2.7 набрав 55.6%, близько до рівня Opus 4.6.

Ця діаграма не стосується того, хто вище або нижче — системи benchmark різняться, порівнювати без обережності не слід. Головне — це «різниця у ціні та продуктивності»: вітчизняні моделі агентів вже досягли одного рівня можливостей, але знаходяться у зовсім різних цінових сегментах.

Триліонні параметри проти самовдосконалення

Ціна — лише зовнішній прояв. Обидві компанії мають абсолютно різні підходи.

MiMo-V2-Pro йде шляхом «великої сили — дивовижних результатів». За офіційним оголошенням Xiaomi, V2-Pro має понад трильйон параметрів, активних 42 мільярди, підтримує довгий контекст до 1 мільйона токенів. Основна інновація — гібридна увага (Hybrid Attention), яка поєднує скользяче вікно уваги (SWA) та глобальну увагу (GA) у співвідношенні 7:1 — попередня модель V2-Flash мала 5:1. Ця архітектура забезпечує стабільність роботи моделі при обробці довгих документів та одночасному використанні кількох інструментів у сценаріях агентів. У PinchBench (оцінка здатності до виклику інструментів) MiMo-V2-Pro отримав 84%.

M2.7 йде зовсім іншим шляхом. За офіційним технічним блогом MiniMax від 18 березня, кількість параметрів M2.7 не розголошується, але вона демонструє механізм «самовдосконалення через ітерації»: модель самостійно виконує понад 100 циклів оптимізації, включаючи аналіз невдач, планування змін, модифікацію власної архітектури, оцінювання, повторне циклювання, що в підсумку дає 30% приросту продуктивності на внутрішніх тестових наборах. У 22 складних завданнях MLE Bench Lite (оцінка складності машинного навчання) M2.7 здобула 9 золотих, 5 срібних і 1 бронзову медаль, середній показник — 66.6%.

З п’яти аспектів два шляхи мають зовсім різний напрямок: MiMo-V2-Pro явно переважає у довжині контексту та кодовій інженерії, тоді як M2.7 — у автоматизації роботи та здатності до самовдосконалення. За даними того ж технічного блогу MiniMax, M2.7 отримала ELO 1495 у тесті GDPval-AA (оцінка обробки офісних документів), що є найвищим серед відкритих моделей, і зберегла 97% відповідності у тесті MM-Claw, що охоплює понад 40 складних навичок.

П’ять місяців — чотири версії

Обидві компанії не лише різняться технічним шляхом, але й темпами оновлення.

За відкритими даними, MiniMax з жовтня 2025 року по березень 2026 року випустила чотири версії: M2, M2.5, M2.7 — кожна приблизно через 49 днів. Між M2.5 і M2.7 — лише близько 30 днів.

У Xiaomi темп інший: у квітні 2025 року — MiMo-7B (відкритий інтелектуальний модель з 7 мільярдами параметрів), у грудні — V2-Flash (з 309 мільярдами параметрів), у березні 2026 — V2-Pro (з трильйоном параметрів). Кожне нове покоління має значно більший масштаб, але інтервал між релізами — довший.

MiniMax обрав малими кроками, з високою частотою оновлень, і механізм самовдосконалення M2.7 створений саме для «безперервної еволюції». Xiaomi ж обирає великий удар — кожна нова версія — значний прорив у масштабі та архітектурі.

Анонімний за 8 днів — на вершину OpenRouter

Крім технічного шляху, стратегія випуску Xiaomi також порушує галузеві норми.

За повідомленням Reuters, 11 березня на глобальній платформі OpenRouter з’явилася анонімна модель Hunter Alpha. Без бренду, без презентації, без технічного блогу. Вона має дуже низьку ціну API, але вражаюче високі характеристики.

Спільнота почала здогадуватися про її походження. За даними Republic World та кількох технічних ЗМІ, найпопулярнішою версією є, що це DeepSeek V4, оскільки керівник команди MiMo, Ло Фулі, раніше працював у DeepSeek. Всього за кілька днів кількість викликів зросла понад 1 трильйоном токенів, і модель піднялася на перше місце у рейтингу OpenRouter.

19 березня вранці Xiaomi офіційно підтвердила: Hunter Alpha — це MiMo-V2-Pro. За повідомленням Reuters, після розкриття вона тимчасово піднялася на 5.8% у гігантському ринку Гонконгу.

Це перший випадок у світі, коли вітчизняна велика модель довела свою якість у глобальній платформі за допомогою чистого сліпого тестування. Без бренду, без реклами, за 8 днів — і з довірою розробників, які голосують ногами.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено