Відкриті моделі наздоганяють, але що саме вони наздоганяють?

Question

## Відкритий код наздоганяє, але треба чітко сказати, де саме він наздогнавZ.ai випустила GLM-5.1, а Modal майже синхронно запустила хостинг. Дві речі, накладені одна на одну, цікавіші, ніж розгляд кожну окремо.Модель — 754B MoE (активні параметри 40B). SWE-Bench Pro: 58,4%. За задачами з кодування вона майже на рівні GPT-5.4 та Opus 4.6; може без проблем працювати в автономному режимі 8 годин, витримуючи тисячі ітерацій без збоїв. BenchLM наразі на 10-му місці, а KernelBench показує, що вона швидша за попередні відкриті рішення у 3,6 раза.Реакції в соцмережах розділилися: Bindu Reddy каже, що це доказ того, що відкритий код наздогнав закритий; Victor Taelin натомість сумнівається, що “500+ tokens/s” є реалістичним у точності FP8 — у реальному розгортанні, ймовірно, буде лише близько 200 tps. Обидві сторони мають рацію — модель справді сильна, але маркетингові цифри, імовірно, оптимістичніші за реальні.Цього разу, порівняно з попередніми релізами відкритого коду, є кілька відмінностей:- **Безкоштовні кінцеві точки Modal змінюють алгоритм доступності та витрат.** Z.ai (раніше Zhipu, зараз котирується в Гонконзі) через Modal доходить до західних розробників, тож розробникам не доводиться перейматися тертям геополітики; ціна $1 за мільйон вхідних токенів також знижує цінову “якірність” для пропрієтарних сервісів.- **Потрібен контекст для просування ефективності інференсу.** GLM-5.1 використовує sparsе mixed attention і асинхронне reinforcement learning, щоб контролювати витрати на розширення. Але “500+ tps” залежать від базової інфраструктури, якої в більшості людей просто немає. Справжнє вузьке місце — у сервісизації та диспетчеризації, а не в “паперових” специфікаціях моделі.- **Можна напряму підключатися до наявного інструментарію.** Сумісність із Claude Code та OpenClaw означає, що її можна прямо замінити у наявних пропрієтарних робочих потоках. Це створює тиск на Anthropic і OpenAI передусім через ціну, а не тому, що здатність зрівняли.MarkTechPost і Constellation трактують це як зближення “6-місячної різниці” між відкритим і закритим кодом. У напрямі кодувальних агентів це, ймовірно, правда. Z.ai має ліцензію MIT, а друге тонке налаштування вже на підході.Але не варто через це думати, що відкритий код повністю “переміг” у всьому. Пропрієтарні моделі все ще суттєво випереджають у безпековому узгодженні та багатомодальному міркуванні. Те, що “розмивається”, — це рівень захисту саме в сценарії кодувальних агентів: у компаніях на такі задачі більше впливають витрати на розгортання, а не чутливість до невеликих відмінностей у граничній спроможності.## Важливіше за саму модель — інфраструктураModal спирається на кластер B200, а GLM-5.1 розгортають через SGLang: у сценаріях взаємодії вона здатна працювати на 30–75 tokens/s. Ці, на перший погляд, нудні інженерні деталі — і є по-справжньому ключовими.Z.ai показала на VectorDBBench пропускну здатність 21,5k QPS (після 600 ітерацій оптимізації). Така продуктивність вимагає безсерверної еластичності Modal, щоб стабільно забезпечувати сервіс; самою лише моделлю до такого рівня не дотягнути.Це також змінює спосіб, як ми дивимося на “релізи моделей”: тепер це не ізольовані події, а частина екосистемної стратегії. Поєднання “відкритої моделі + західної інфраструктури” стало способом застрахування проти фіксації на API однієї лабораторії.Щодо меж GLM-5.1: за кодувальними бенчмарками вона досягає 94,6% від Opus, але різниця в інференсі ще лишається. Більш “збалансований” профіль здібностей важливіший для конкретних сценаріїв використання.Рух уперед: у Z.ai минулого року виторг зріс на 131% у річному обчисленні. Якщо витрати на інференс знизяться до $0.50/мільйон tokens, то відкритий код має шанс протягом року завоювати 30–50% частки розгортань кодувальних агентів. Зміни в політиці США можуть внести коливання, але на даний момент ризики виглядають невисокими.| Позиція | Докази | Вплив на індустрію | Моя оцінка ||---|---|---|---|| Оптимісти щодо відкритого коду | SWE-Bench Pro 58,4%, 8 годин автономного запуску | Компанії починають пілотувати відкритий код як заміну | Трошки перебільшення.** Перевага — в інтеграції та доступності, а не в бальних результатах. Modal безкоштовна проба важливіша за позиції в рейтингах.** || Захисники пропрієтарного коду | BenchLM 10-те місце, інференсна спроможність все ще гірша за Opus | Закритий код і далі лідирує в безпеці та багатомодальності | **Невідповідність у ціноутворенні.** Ефективність GLM стискає цінову владу опонентів, і Anthropic має відповісти. || Прагматики інфраструктури | Modal ендпойнт, сумісність OpenClaw | Капітал концентрується на безсерверних платформах | **Ось що справді ключове.** Хто б не переміг серед моделей, виграють інфраструктурні компанії. || Геополітичні скептики | Z.ai котирується в Гонконзі, ліцензія MIT, напруження між США і Китаєм | Походження моделей буде під більш пильним розглядом | Поки що переоцінено. Реальніше стежити за** простором для монетизації із західними хостинговими партнерами**. |**Висновок:** Цей “подвійний удар” підтверджує одну річ: у вертикалі кодувальних агентів можливості відкритого коду вже майже зрівнялися. Виграють ті, хто першими збудували “інфраструктурно-незалежну” архітектуру, а також інвестори, які розмістилися в хостингових платформах. Anthropic стикається з ціновим тиском. Компанії, глибоко прив’язані до закритих API, платять премію за те, що здатність безперервно зменшує розрив.**Важливість:** Висока  **Категорія:** Релізи моделей, партнерства, відкритий код**Оцінка:** Для ринку кодувальних агентів це все ще відносно раннє “вікно”. Першими з цього виграють дві групи людей: (1) будівничі та інтегратори, які створюють інфраструктурно-незалежні робочі процеси; (2) фінансисти, що роблять ставку на безсерверний хостинг і платформи для інференсу. На короткій дистанції трейдерам, якщо вони не здатні вловити темп зниження цін і міграції трафіку, перевага буде обмеженою; на довгій дистанції власникам потрібно стежити, чи справді крива витрат спускається нижче $0.50/мільйон tokens, щоб перевірити, чи може частка стрибнути.

Відкриті моделі наздоганяють, але що саме вони наздоганяють?

Відкритий код наздоганяє, але треба чітко сказати, де саме він наздогнав

Важливіше за саму модель — інфраструктура

Популярні теми

GateLaunchesPreIPOS

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

OilEdgesHigher

USIranCeasefireTalksFaceSetbacks

Популярні активності Gate Fun

WC

旺财

fal

falcon

GT13

GT13

LOP

LOP

RMWS

人民万岁

Закріпити

Позиція	Докази	Вплив на індустрію	Моя оцінка
Оптимісти щодо відкритого коду	SWE-Bench Pro 58,4%, 8 годин автономного запуску	Компанії починають пілотувати відкритий код як заміну	Трошки перебільшення. Перевага — в інтеграції та доступності, а не в бальних результатах. Modal безкоштовна проба важливіша за позиції в рейтингах.
Захисники пропрієтарного коду	BenchLM 10-те місце, інференсна спроможність все ще гірша за Opus	Закритий код і далі лідирує в безпеці та багатомодальності	Невідповідність у ціноутворенні. Ефективність GLM стискає цінову владу опонентів, і Anthropic має відповісти.
Прагматики інфраструктури	Modal ендпойнт, сумісність OpenClaw	Капітал концентрується на безсерверних платформах	Ось що справді ключове. Хто б не переміг серед моделей, виграють інфраструктурні компанії.
Геополітичні скептики	Z.ai котирується в Гонконзі, ліцензія MIT, напруження між США і Китаєм	Походження моделей буде під більш пильним розглядом	Поки що переоцінено. Реальніше стежити за простором для монетизації із західними хостинговими партнерами.