Відкриті моделі наздоганяють, але що саме вони наздоганяють?

robot
Генерація анотацій у процесі

Відкритий код наздоганяє, але треба чітко сказати, де саме він наздогнав

Z.ai випустила GLM-5.1, а Modal майже синхронно запустила хостинг. Дві речі, накладені одна на одну, цікавіші, ніж розгляд кожну окремо.

Модель — 754B MoE (активні параметри 40B). SWE-Bench Pro: 58,4%. За задачами з кодування вона майже на рівні GPT-5.4 та Opus 4.6; може без проблем працювати в автономному режимі 8 годин, витримуючи тисячі ітерацій без збоїв. BenchLM наразі на 10-му місці, а KernelBench показує, що вона швидша за попередні відкриті рішення у 3,6 раза.

Реакції в соцмережах розділилися: Bindu Reddy каже, що це доказ того, що відкритий код наздогнав закритий; Victor Taelin натомість сумнівається, що “500+ tokens/s” є реалістичним у точності FP8 — у реальному розгортанні, ймовірно, буде лише близько 200 tps. Обидві сторони мають рацію — модель справді сильна, але маркетингові цифри, імовірно, оптимістичніші за реальні.

Цього разу, порівняно з попередніми релізами відкритого коду, є кілька відмінностей:

  • Безкоштовні кінцеві точки Modal змінюють алгоритм доступності та витрат. Z.ai (раніше Zhipu, зараз котирується в Гонконзі) через Modal доходить до західних розробників, тож розробникам не доводиться перейматися тертям геополітики; ціна $1 за мільйон вхідних токенів також знижує цінову “якірність” для пропрієтарних сервісів.
  • Потрібен контекст для просування ефективності інференсу. GLM-5.1 використовує sparsе mixed attention і асинхронне reinforcement learning, щоб контролювати витрати на розширення. Але “500+ tps” залежать від базової інфраструктури, якої в більшості людей просто немає. Справжнє вузьке місце — у сервісизації та диспетчеризації, а не в “паперових” специфікаціях моделі.
  • Можна напряму підключатися до наявного інструментарію. Сумісність із Claude Code та OpenClaw означає, що її можна прямо замінити у наявних пропрієтарних робочих потоках. Це створює тиск на Anthropic і OpenAI передусім через ціну, а не тому, що здатність зрівняли.

MarkTechPost і Constellation трактують це як зближення “6-місячної різниці” між відкритим і закритим кодом. У напрямі кодувальних агентів це, ймовірно, правда. Z.ai має ліцензію MIT, а друге тонке налаштування вже на підході.

Але не варто через це думати, що відкритий код повністю “переміг” у всьому. Пропрієтарні моделі все ще суттєво випереджають у безпековому узгодженні та багатомодальному міркуванні. Те, що “розмивається”, — це рівень захисту саме в сценарії кодувальних агентів: у компаніях на такі задачі більше впливають витрати на розгортання, а не чутливість до невеликих відмінностей у граничній спроможності.

Важливіше за саму модель — інфраструктура

Modal спирається на кластер B200, а GLM-5.1 розгортають через SGLang: у сценаріях взаємодії вона здатна працювати на 30–75 tokens/s. Ці, на перший погляд, нудні інженерні деталі — і є по-справжньому ключовими.

Z.ai показала на VectorDBBench пропускну здатність 21,5k QPS (після 600 ітерацій оптимізації). Така продуктивність вимагає безсерверної еластичності Modal, щоб стабільно забезпечувати сервіс; самою лише моделлю до такого рівня не дотягнути.

Це також змінює спосіб, як ми дивимося на “релізи моделей”: тепер це не ізольовані події, а частина екосистемної стратегії. Поєднання “відкритої моделі + західної інфраструктури” стало способом застрахування проти фіксації на API однієї лабораторії.

Щодо меж GLM-5.1: за кодувальними бенчмарками вона досягає 94,6% від Opus, але різниця в інференсі ще лишається. Більш “збалансований” профіль здібностей важливіший для конкретних сценаріїв використання.

Рух уперед: у Z.ai минулого року виторг зріс на 131% у річному обчисленні. Якщо витрати на інференс знизяться до $0.50/мільйон tokens, то відкритий код має шанс протягом року завоювати 30–50% частки розгортань кодувальних агентів. Зміни в політиці США можуть внести коливання, але на даний момент ризики виглядають невисокими.

Позиція Докази Вплив на індустрію Моя оцінка
Оптимісти щодо відкритого коду SWE-Bench Pro 58,4%, 8 годин автономного запуску Компанії починають пілотувати відкритий код як заміну Трошки перебільшення.** Перевага — в інтеграції та доступності, а не в бальних результатах. Modal безкоштовна проба важливіша за позиції в рейтингах.**
Захисники пропрієтарного коду BenchLM 10-те місце, інференсна спроможність все ще гірша за Opus Закритий код і далі лідирує в безпеці та багатомодальності Невідповідність у ціноутворенні. Ефективність GLM стискає цінову владу опонентів, і Anthropic має відповісти.
Прагматики інфраструктури Modal ендпойнт, сумісність OpenClaw Капітал концентрується на безсерверних платформах Ось що справді ключове. Хто б не переміг серед моделей, виграють інфраструктурні компанії.
Геополітичні скептики Z.ai котирується в Гонконзі, ліцензія MIT, напруження між США і Китаєм Походження моделей буде під більш пильним розглядом Поки що переоцінено. Реальніше стежити за** простором для монетизації із західними хостинговими партнерами**.

Висновок: Цей “подвійний удар” підтверджує одну річ: у вертикалі кодувальних агентів можливості відкритого коду вже майже зрівнялися. Виграють ті, хто першими збудували “інфраструктурно-незалежну” архітектуру, а також інвестори, які розмістилися в хостингових платформах. Anthropic стикається з ціновим тиском. Компанії, глибоко прив’язані до закритих API, платять премію за те, що здатність безперервно зменшує розрив.

Важливість: Висока
Категорія: Релізи моделей, партнерства, відкритий код

Оцінка: Для ринку кодувальних агентів це все ще відносно раннє “вікно”. Першими з цього виграють дві групи людей: (1) будівничі та інтегратори, які створюють інфраструктурно-незалежні робочі процеси; (2) фінансисти, що роблять ставку на безсерверний хостинг і платформи для інференсу. На короткій дистанції трейдерам, якщо вони не здатні вловити темп зниження цін і міграції трафіку, перевага буде обмеженою; на довгій дистанції власникам потрібно стежити, чи справді крива витрат спускається нижче $0.50/мільйон tokens, щоб перевірити, чи може частка стрибнути.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$0.1Холдери:0
    0.00%
  • Закріпити