MiniMax випустила велику модель M3: програмні можливості перевищують GPT-5.5, підтримують нативне мультимодальне настільне управління

Звіт з Coinjie, MiniMax офіційно випустила велику модель M3 сьогодні. M3 є наразі єдиною відкритою моделлю, яка повністю поєднує передові елементи програмування, наддовгий контекст і нативну мультимодальність, планується офіційне відкриття ваг упродовж 10 днів. Вона досягає світового рівня у генерації коду, агентів і настільному управлінні, її можна випробувати у MiniMax code, token plan та API. M3 вперше застосувала розріджену архітектуру уваги MSA, яка агрегує запити через блоки KV, швидше за Flash-sparse-attention у 4 рази. При контексті близько 1 мільйона, нова архітектура зменшує обчислювальне навантаження на кожен токен до 1/20 попередніх поколінь, забезпечуючи прискорення заповнення у 9 разів і декодування у 15 разів. На платформі SWE-bench pro M3 досягла результату 59.0%, перевищуючи GPT-5.5 і Gemini 3.1 pro, наближаючись до Opus 4.7. У задачах оптимізації FP8 на Hopper, за 24 години вона самостійно викликала інструменти 1959 разів, підвищивши використання апаратного забезпечення з 7.6% до 71.3%, прискоривши у 9.4 рази. API вже доступний, пропонує режими для розгадування та швидкого режиму, план відкриття ваг упродовж 10 днів.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • 1
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
ThereIsTvlInTheWind
· 5год тому
SWE-bench pro 59% перевищує GPT-5.5, справжній прорив у сфері кодування
Переглянути оригіналвідповісти на0
SymbolsInTheReflection
· 5год тому
Архітектура MSA забезпечує швидкість доступу до пам’яті у 4 рази вищу, ніж раніше, а Flash-sparse-attention стала фоном.
Переглянути оригіналвідповісти на0
ThereAreCatsInTheContract.
· 5год тому
Квантовий блок агрегації для пошуку за попаданням, технічні деталі та аналіз наукових статей
Переглянути оригіналвідповісти на0
PerpPulse
· 5год тому
Gemini 3.1 перевищено? Тиск з боку Google посилився
Переглянути оригіналвідповісти на0
TeaAndSlippage
· 5год тому
Програмування + надзвичайно довгий контекст + нативна мультимодальність у трьох напрямках, єдина у своєму роді відкритий шлях
Переглянути оригіналвідповісти на0
GateUser-f7b40cee
· 5год тому
Код MiniMax та API вже доступні для тестування, просто спробуйте.
Переглянути оригіналвідповісти на0
DuskStop-LossLine
· 5год тому
Настільне управління до світового рівня, впровадження AI-агента зробило ще один крок вперед
Переглянути оригіналвідповісти на0
AirdropMileCounter
· 5год тому
Попереднє заповнення у 9 разів, розкод у 15 разів — ця швидкість справді неймовірна
Переглянути оригіналвідповісти на0
  • Закріплено