GLM-5.1 результати тестів виглядають добре, але на практиці все ще інша справа: апаратні вимоги та різниця у валідації залишаються.

robot
Генерація анотацій у процесі

Demo і реальне розгортання — це дві різні речі

Z.ai з GLM-5.1 на довгострокових задачах грає карту “відкритого коду”, голосно заявляючи про це, але популярність випереджає фактичну зручність використання. Офіційно стверджують, що він є першим у відкритому коді, третім у світі за показниками SWE-Bench Pro (58.4%), Terminal-Bench (63.5%) і NL2Repo (42.7%), а також перевищує GPT-5.4 на SWE-Bench із 57.7%. Але незалежні тести розповідають іншу історію — Claude Opus 4.6 досягає 75–80% на підтверджуваних підмножинах. Базові тестові задачі Z.ai більше схожі на гру на сильних сторонах, але не дають відповіді, наскільки модель стабільна у виробничих умовах.

У Twitter повно демонстрацій GLM-5.1 у інструментах, таких як Claude Code. Але що не згадується — це високі апаратні вимоги. Більшість незалежних розробників не можуть їх запустити, що піднімає незручне питання: модель, яка потребує корпоративних обчислювальних ресурсів, що означає “відкритий код”?

  • Довіра інвесторів не дуже стабільна: IPO Z.ai оцінюється приблизно в 3 мільярди доларів, залучено 400 мільйонів, але ціна акцій у лютому 2026 року впала на 23%. Недостатність обчислювальних ресурсів — реальна проблема, і ринок вже це відобразив.
  • Загалом корпоративний хедж: ліцензія MIT для GLM-5.1 і до 8 годин автономного кодування мають практичну цінність, але у довготривалих навантаженнях вони все ще поступаються Opus від Anthropic. Більшість покупців залишають закриті API для ключових задач.
  • “Відкритий код — перемога” — занадто рано говорити: без субсидій на обчислювальні ресурси (наприклад, у співпраці з io.net), модель такого розміру для більшості розробників залишається недосяжною, і вона ще не зламала робочий процес великих компаній.

Апаратні бар’єри викликають важкий вибір

Обговорення GLM-5.1 розділяє думки — це цілком очікувано. AI-інженери демонструють ітеративні рішення; дослідники DeepMind вказують, що у довгих діалогах важко обробляти залежності між файлами.

Z.ai явно орієнтується на високоефективну логіку — підтримує чіпи Huawei Ascend, сумісний з vLLM — але 754 мільярди параметрів мінімум потребують FP8 квантизацію. Якщо ви — досліджувальна лабораторія з достатнім фінансуванням у країні, проблем не виникне; інші — не обов’язково.

Фінансування теж розповідає історію. Участь Prosperity7 означає геополітичний хедж, але внесення до списку експортних обмежень у 2025 році обмежує міжнародне розширення Z.ai. Це більше схоже на “внутрішнього чемпіона”, ніж на “глобального конкурента”.

Хто говорить На основі чого Як впливає на дискусію Практичне значення
Підтримувачі відкритого коду Демонстрації у Twitter, самостійне тестування з результатами вище Opus Більше розробників пробують відкриті інструменти, зростає кількість завантажень Hugging Face Занадто перебільшено. Різниця у 10–20% у підтверджувальних тестах — критична, незалежні розробники недооцінюють вартість впровадження.
Підтримувачі закритих моделей Незалежні рейтинги (swebench.com) показують Claude 76.8%, Z.ai самі визнають нестачу обчислювальних ресурсів Підсилює думку, що “стабільність і масштабованість” все ще схиляється на бік великих компаній Обґрунтовано, але неповно. Якщо співпраця зменшить ціну на обчислювальні ресурси, захисна стіна буде прорвана.
Спостерігачі геополітики Лістинг Z.ai на гонконгській біржі, заборона у США, участь Prosperity7 у Саудівській Аравії Більше уваги до націоналізації AI і диверсифікації ланцюжків постачання Це головна тема. Ринок розділяється, інвестори, що роблять ставку на “азіатський AI стек”, мають перевагу.
Бізнес-покупці $10/місяць за кодування проти $200/місяць у конкурентів, але апаратні вимоги залишаються Витрати і вигоди аналізуються ретельніше, відкриті альтернативи просуваються повільніше Обережність правильна. Z.ai підходить для задач середньої складності; високоризикові задачі краще залишити закритим моделям.

Підсумок: Якщо ви ставите все на “відкритий код — революція”, можливо, ще зарано. Закриті моделі все ще переважають у надійності. Для бізнесу: використовуйте відкриті ваги, щоб економити, а у виробничому середовищі залишайте закриті API. Для інвесторів: позиціонування Z.ai у Азії заслуговує уваги, але за умови, що ви слідкуєте за геополітичними аспектами обчислювальних ресурсів.

Важливість: Висока
Категорія: Випуск моделей, Технічний аналіз, Вплив на ринок

Вердикт: Заяви про те, що “відкритий код незабаром повністю витіснить закритий”, наразі передчасні; короткостроково переваги мають постачальники закритих API і великі лабораторії з достатніми обчислювальними ресурсами. Вигідні для різних ролей:

  • Створювачі (builders): якщо у азіатській екосистемі обчислювальних ресурсів, з субсидіями або місцевим обладнанням, варто тестувати на середніх робочих потоках; інакше — нерентабельно.
  • Трейдери (traders): можна торгувати тематичними інструментами, але слідкувати за співпрацею у сфері обчислювальних ресурсів і регуляторними тенденціями, швидко входити і виходити.
  • Довгострокові інвестори і фонди: мають перевагу ті організації, що можуть розвивати азіатський AI стек і диверсифікувати ланцюжки постачання; без цих ресурсів — не в плюсі.
GLM0,3%
IO-0,34%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити