Microsoft AI випустила першу модель для розуміння MAI-Thinking-1 та шість нових вбудованих моделей, запустила приватну послугу «передове тонке налаштування» для підкріпленого навчання

За даними моніторингу Beating, керівник відділу штучного інтелекту Microsoft (Microsoft AI, коротко MAI) Мустафа Сулейман (Mustafa Suleyman) оголосив на конференції розробників Build 2026 про запуск нової власної лінійки моделей MAI. Ця серія складається з 7 моделей, що охоплюють сфери логіки, програмування, зображень, транскрипції та голосу, всі вони були навчені Microsoft з нуля без використання сторонніх моделей для знань, і всі набори даних отримані з дотриманням нормативних вимог. Microsoft заявила, що прагне створити «людинолюбний суперінтелект (Humanist Superintelligence)», забезпечуючи, щоб передові AI слугували допоміжним інструментом для людини і підлягали людському контролю. Також, вже запущений кластер обчислювальної потужності GB200 повністю введений в експлуатацію для підтримки безперервної еволюції цієї екосистеми моделей.

Флагманська модель логіки MAI-Thinking-1 має 35 мільярдів активних параметрів, використовує архітектуру гібридних експертів (MoE) і пропонує вікно контексту до 128 тисяч. У таких основних оцінках, як SWE-bench Pro та інші оцінки програмування і математичних логік, ця модель досягла рівня, порівнянного з Claude Opus 4.6, а в сліпих людських тестах перевищила Claude Sonnet 4.6.

Для сценаріїв програмування, MAI представила модель інтелектуального агента MAI-Code-1-Flash з 5 мільярдами параметрів, яка глибоко інтегрована з GitHub Copilot і VS Code, забезпечуючи продуктивність, що порівнюється з Claude Haiku, при менших витратах на логіку.

У мультимодальній сфері MAI-Image-2.5 та її варіанти Flash підтримують високоточне створення з тексту до зображень і редагування зображень, при цьому якість зображень перевищує Nano Banana Pro; у голосовій та транскрипційній сферах запущено модель MAI-Transcribe-1.5 з SOTA точністю і швидкістю у 5 разів вищою за конкурентів, а також модель MAI-Voice-2 та її Flash-варіант, що підтримують 15 мов, мають емоційний контроль і нульовий зразок клонування голосу.

Ці моделі не лише розгорнуті в Azure AI Foundry, але й будуть доступні на платформах OpenRouter, Fireworks і Baseten, з можливістю для розробників самостійно налаштовувати ваги моделей. Microsoft також повідомила, що шляхом спільної оптимізації моделей з власним чипом Maia 200 досягнуто 1,4-кратного підвищення обчислювальної ефективності.

Крім випуску базових моделей, Microsoft запустила сервіс «Передове тонке налаштування (Frontier Tuning)» на основі середовища підкріпленого навчання (RLE). Цей сервіс дозволяє компаніям у повністю контрольованому ізольованому середовищі («тренувальний зал») проводити кастомізацію моделей MAI, використовуючи внутрішні траєкторії операцій, послідовності рішень і професійні дані. Тестування показало, що після Frontier Tuning кастомізовані моделі значно підвищують продуктивність, наприклад, модель MAI, оптимізована для Excel, досягає рівня GPT-5.4, але в 10 разів швидше; модель, створена для McKinsey, досягла найвищої ймовірності перемоги при майже 10-кратному зниженні витрат.

Крім того, Microsoft оголосила про стратегічну співпрацю з провідною медичною установою Mayo Clinic для спільної розробки клінічної логічної великої моделі на основі клінічних даних Mayo і платформи Microsoft AI. Ця модель належить Mayo Clinic, спершу буде розгорнута всередині Mayo для ранньої діагностики та розробки лікувальних планів, а згодом стане доступною для інших медичних закладів через Azure AI Foundry.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • 1
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
GateUser-d6fb8ff1
· 3год тому
Муссафа Сулейман перейшов з Inflection до Microsoft і зараз представляє перший звіт про результати
Переглянути оригіналвідповісти на0
SaveABitOnGasFees
· 3год тому
Треті сторони не використовують дистиляцію, повністю власний шлях розробки, витрати та ризики максимально високі, але при цьому контроль над голосом цілком у своїх руках.
Переглянути оригіналвідповісти на0
GateUser-dce566e8
· 3год тому
Build 2026 ще не відкрився, чи ця новина була витоку заздалегідь?
Переглянути оригіналвідповісти на0
GateUser-de0b9e3b
· 3год тому
7 моделей повністю власної розробки, тренування з нуля — скільки ж це коштує?
Переглянути оригіналвідповісти на0
MountainShadowsBeforeTheStorm
· 3год тому
Чи збирається Microsoft повністю позбавитися залежності від OpenAI?
Переглянути оригіналвідповісти на0
  • Закріплено