Открытые модели догоняют, но что именно они догоняют?

Question

## Похоже, что open source догоняет, но важно понимать, КОГО и ГДЕ именно он догналZ.ai выпустила GLM-5.1, а Modal почти синхронно запустил хостинг. Две вещи, наложенные друг на друга, куда интереснее, чем рассматривать каждую по отдельности.Модель — 754B MoE (активируемые параметры 40B). Результат на SWE-Bench Pro — 58,4%; по задачам кодирования она примерно на уровне GPT-5.4 и Opus 4.6; может в автономном режиме работать до 8 часов, выдерживая тысячи итераций без падений. Сейчас BenchLM занимает 10-е место, а KernelBench показывает, что она быстрее предыдущих open source-решений в 3,6 раза.В соцсетях реакция разделилась: Bindu Reddy говорит, что это доказательство того, что open source догнал closed source; Victor Taelin же сомневается, что «500+ tokens/s» реалистично при точности FP8 — в реальном развертывании, вероятно, будет около 200 tps. В каждом аргументе есть доля правды — модель действительно сильная, но маркетинговые цифры выглядят чересчур оптимистично.На этот раз в выпуске open source есть несколько отличий от прошлых релизов:- **Бесплатные конечные точки Modal меняют алгоритмы доступности и стоимости.** Z.ai (прежнее название — Zhipu, сейчас публичная компания в Гонконге) через Modal выходит на западных разработчиков, и разработчикам не нужно беспокоиться о геополитических трениях; цена $1/миллион входных токенов также снижает «якорь» для стоимости специализированных сервисов.- **Для рекламы эффективности инференса нужен контекст.** GLM-5.1 использует разреженное смешанное внимание и асинхронное усиленное обучение, чтобы контролировать стоимость масштабирования. Но «500+ tps» зависят от инфраструктуры, которой у большинства людей просто нет. Реальное узкое место — в сервисной модели и диспетчеризации, а не в спецификациях на бумаге.- **Можно напрямую подключать к существующей цепочке инструментов.** Совместимость с Claude Code и OpenClaw означает, что ее можно сразу заменить в существующих проприетарных рабочих процессах. Это создает давление на Anthropic и OpenAI главным образом по цене, а не потому, что их возможности «сравнялись».MarkTechPost и Constellation трактуют это как сближение «разрыва в 6 месяцев» между open source и closed source. В направлении кодинговых агентов это, скорее всего, верная оценка. Z.ai использует лицензию MIT, а доработки для второй стадии fine-tuning уже на подходе.Но не стоит из-за этого думать, что open source полностью «переворачивает столы». Проприетарные модели по-прежнему намного впереди по безопасности и согласованию (alignment), а также по мультимодальному инференсу. То, что размывается, — это оборонительный контур именно в сценарии кодинговых агентов: компании в таких задачах больше ценят стоимость развертывания, и к небольшой разнице в маржинальных возможностях относятся менее чувствительно.## Важнее модели — инфраструктураModal базируется на кластере B200; GLM-5.1 разворачивается с помощью SGLang, и в интерактивных сценариях работает на скорости 30–75 tokens/s. Эти, казалось бы, скучные инженерные детали — как раз и оказываются по-настоящему важными.Z.ai на VectorDBBench демонстрирует пропускную способность 21,5k QPS (после 600 итераций оптимизации). Такая производительность требует серверлесс-эластичности Modal, чтобы стабильно доставлять результат в нужном масштабе; одной только модели до этого уровня не добраться.Это также меняет то, как мы смотрим на «релизы моделей»: теперь это не изолированные события, а часть стратегии экосистемы. Комбинация «open source-модель + западная инфраструктура» стала хеджем против привязки к API одной единственной лаборатории.О границах GLM-5.1: по кодинговым бенчмаркам она достигает 94,6% от Opus, но разрыв в инференсе все еще сохраняется. Более «сбалансированная» картина возможностей важнее для конкретных сценариев.Дальше по курсу: выручка Z.ai в прошлом году выросла на 131% год-к-году. Если стоимость инференса снизится до $0.50/миллион токенов или ниже, open source сможет в течение года занять 30–50% доли развертываний кодинговых агентов. Изменения в политике США могут внести возмущения, но текущие риски выглядят не слишком высокими.| Взгляд | Доказательства | Влияние на отрасль | Мое суждение ||---|---|---|---|| Оптимисты по open source | SWE-Bench Pro 58,4%, автономная работа 8 часов | Компании начинают пилотировать open source вместо замены | Похоже на преувеличение. **Преимущество — в интеграции и доступности, а не в баллах. Испытание Modal бесплатно важнее, чем позиция в рейтинге.** || Хранители closed source | BenchLM 10-е место, инференс-возможности все еще уступают Opus | Closed source продолжает лидировать в безопасности и мультимодальности | **Несовпадение в цене.** Эффективность GLM сжимает ценовую власть оппонента, и Anthropic придется отвечать. || Прагматики по инфраструктуре | Конечная точка Modal, совместимость OpenClaw | Капитал концентрируется на серверлесс-платформах | **Вот что ключевое.** Независимо от того, какая модель победит, выгоду получают инфраструктурные компании. || Скептики по геополитике | Публичный статус Z.ai в Гонконге, лицензия MIT, напряжение между США и Китаем | Источник модели будет подвергаться большему вниманию | Пока переоценка. Более практично — следить за **пространством монетизации вместе с западными хостинг-партнерами**. |**Итог: ** Этот «комбо-пакет» подтверждает одну вещь: в вертикали кодинговых агентов возможности open source уже практически догнали. Выигрывают те, кто первым строит «инфраструктурно-независимую» архитектуру Builder, а также инвесторы, делающие ставку на хостинговые платформы. Anthropic сталкивается с ценовым давлением. Компании, которые глубоко привязаны к closed source API, сейчас платят премию за то, что возможности продолжают сокращаться.**Важность: ** Высокая  **Категория: ** релизы моделей, сотрудничество, open source**Оценка: ** Для сегмента кодинговых агентов окно все еще относительно раннее. В краткосроке первыми выигрывают две категории людей: (1) Builders и интеграторы, строящие инфраструктурно-независимые рабочие процессы; (2) инвесторы, делающие ставку на серверлесс-хостинг и инференс-платформы. Краткосрочным трейдерам преимущество будет ограниченным, если только они не смогут поймать ритм снижения цен и миграции трафика; долгосрочным держателям нужно следить за тем, действительно ли кривая затрат опустится ниже $0.50/миллион токенов, чтобы проверить, сможет ли доля перейти на новый уровень.

Открытые модели догоняют, но что именно они догоняют?

Похоже, что open source догоняет, но важно понимать, КОГО и ГДЕ именно он догнал

Важнее модели — инфраструктура

Популярные темы

GateLaunchesPreIPOS

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

OilEdgesHigher

USIranCeasefireTalksFaceSetbacks

Горячее на Gate Fun

WC

旺财

fal

falcon

GT13

GT13

LOP

LOP

RMWS

人民万岁

Закрепить

Взгляд	Доказательства	Влияние на отрасль	Мое суждение
Оптимисты по open source	SWE-Bench Pro 58,4%, автономная работа 8 часов	Компании начинают пилотировать open source вместо замены	Похоже на преувеличение. Преимущество — в интеграции и доступности, а не в баллах. Испытание Modal бесплатно важнее, чем позиция в рейтинге.
Хранители closed source	BenchLM 10-е место, инференс-возможности все еще уступают Opus	Closed source продолжает лидировать в безопасности и мультимодальности	Несовпадение в цене. Эффективность GLM сжимает ценовую власть оппонента, и Anthropic придется отвечать.
Прагматики по инфраструктуре	Конечная точка Modal, совместимость OpenClaw	Капитал концентрируется на серверлесс-платформах	Вот что ключевое. Независимо от того, какая модель победит, выгоду получают инфраструктурные компании.
Скептики по геополитике	Публичный статус Z.ai в Гонконге, лицензия MIT, напряжение между США и Китаем	Источник модели будет подвергаться большему вниманию	Пока переоценка. Более практично — следить за пространством монетизации вместе с западными хостинг-партнерами.