Открытые модели догоняют, но что именно они догоняют?

robot
Генерация тезисов в процессе

Похоже, что open source догоняет, но важно понимать, КОГО и ГДЕ именно он догнал

Z.ai выпустила GLM-5.1, а Modal почти синхронно запустил хостинг. Две вещи, наложенные друг на друга, куда интереснее, чем рассматривать каждую по отдельности.

Модель — 754B MoE (активируемые параметры 40B). Результат на SWE-Bench Pro — 58,4%; по задачам кодирования она примерно на уровне GPT-5.4 и Opus 4.6; может в автономном режиме работать до 8 часов, выдерживая тысячи итераций без падений. Сейчас BenchLM занимает 10-е место, а KernelBench показывает, что она быстрее предыдущих open source-решений в 3,6 раза.

В соцсетях реакция разделилась: Bindu Reddy говорит, что это доказательство того, что open source догнал closed source; Victor Taelin же сомневается, что «500+ tokens/s» реалистично при точности FP8 — в реальном развертывании, вероятно, будет около 200 tps. В каждом аргументе есть доля правды — модель действительно сильная, но маркетинговые цифры выглядят чересчур оптимистично.

На этот раз в выпуске open source есть несколько отличий от прошлых релизов:

  • Бесплатные конечные точки Modal меняют алгоритмы доступности и стоимости. Z.ai (прежнее название — Zhipu, сейчас публичная компания в Гонконге) через Modal выходит на западных разработчиков, и разработчикам не нужно беспокоиться о геополитических трениях; цена $1/миллион входных токенов также снижает «якорь» для стоимости специализированных сервисов.
  • Для рекламы эффективности инференса нужен контекст. GLM-5.1 использует разреженное смешанное внимание и асинхронное усиленное обучение, чтобы контролировать стоимость масштабирования. Но «500+ tps» зависят от инфраструктуры, которой у большинства людей просто нет. Реальное узкое место — в сервисной модели и диспетчеризации, а не в спецификациях на бумаге.
  • Можно напрямую подключать к существующей цепочке инструментов. Совместимость с Claude Code и OpenClaw означает, что ее можно сразу заменить в существующих проприетарных рабочих процессах. Это создает давление на Anthropic и OpenAI главным образом по цене, а не потому, что их возможности «сравнялись».

MarkTechPost и Constellation трактуют это как сближение «разрыва в 6 месяцев» между open source и closed source. В направлении кодинговых агентов это, скорее всего, верная оценка. Z.ai использует лицензию MIT, а доработки для второй стадии fine-tuning уже на подходе.

Но не стоит из-за этого думать, что open source полностью «переворачивает столы». Проприетарные модели по-прежнему намного впереди по безопасности и согласованию (alignment), а также по мультимодальному инференсу. То, что размывается, — это оборонительный контур именно в сценарии кодинговых агентов: компании в таких задачах больше ценят стоимость развертывания, и к небольшой разнице в маржинальных возможностях относятся менее чувствительно.

Важнее модели — инфраструктура

Modal базируется на кластере B200; GLM-5.1 разворачивается с помощью SGLang, и в интерактивных сценариях работает на скорости 30–75 tokens/s. Эти, казалось бы, скучные инженерные детали — как раз и оказываются по-настоящему важными.

Z.ai на VectorDBBench демонстрирует пропускную способность 21,5k QPS (после 600 итераций оптимизации). Такая производительность требует серверлесс-эластичности Modal, чтобы стабильно доставлять результат в нужном масштабе; одной только модели до этого уровня не добраться.

Это также меняет то, как мы смотрим на «релизы моделей»: теперь это не изолированные события, а часть стратегии экосистемы. Комбинация «open source-модель + западная инфраструктура» стала хеджем против привязки к API одной единственной лаборатории.

О границах GLM-5.1: по кодинговым бенчмаркам она достигает 94,6% от Opus, но разрыв в инференсе все еще сохраняется. Более «сбалансированная» картина возможностей важнее для конкретных сценариев.

Дальше по курсу: выручка Z.ai в прошлом году выросла на 131% год-к-году. Если стоимость инференса снизится до $0.50/миллион токенов или ниже, open source сможет в течение года занять 30–50% доли развертываний кодинговых агентов. Изменения в политике США могут внести возмущения, но текущие риски выглядят не слишком высокими.

Взгляд Доказательства Влияние на отрасль Мое суждение
Оптимисты по open source SWE-Bench Pro 58,4%, автономная работа 8 часов Компании начинают пилотировать open source вместо замены Похоже на преувеличение. Преимущество — в интеграции и доступности, а не в баллах. Испытание Modal бесплатно важнее, чем позиция в рейтинге.
Хранители closed source BenchLM 10-е место, инференс-возможности все еще уступают Opus Closed source продолжает лидировать в безопасности и мультимодальности Несовпадение в цене. Эффективность GLM сжимает ценовую власть оппонента, и Anthropic придется отвечать.
Прагматики по инфраструктуре Конечная точка Modal, совместимость OpenClaw Капитал концентрируется на серверлесс-платформах Вот что ключевое. Независимо от того, какая модель победит, выгоду получают инфраструктурные компании.
Скептики по геополитике Публичный статус Z.ai в Гонконге, лицензия MIT, напряжение между США и Китаем Источник модели будет подвергаться большему вниманию Пока переоценка. Более практично — следить за пространством монетизации вместе с западными хостинг-партнерами.

**Итог: ** Этот «комбо-пакет» подтверждает одну вещь: в вертикали кодинговых агентов возможности open source уже практически догнали. Выигрывают те, кто первым строит «инфраструктурно-независимую» архитектуру Builder, а также инвесторы, делающие ставку на хостинговые платформы. Anthropic сталкивается с ценовым давлением. Компании, которые глубоко привязаны к closed source API, сейчас платят премию за то, что возможности продолжают сокращаться.

**Важность: ** Высокая
**Категория: ** релизы моделей, сотрудничество, open source

**Оценка: ** Для сегмента кодинговых агентов окно все еще относительно раннее. В краткосроке первыми выигрывают две категории людей: (1) Builders и интеграторы, строящие инфраструктурно-независимые рабочие процессы; (2) инвесторы, делающие ставку на серверлесс-хостинг и инференс-платформы. Краткосрочным трейдерам преимущество будет ограниченным, если только они не смогут поймать ритм снижения цен и миграции трафика; долгосрочным держателям нужно следить за тем, действительно ли кривая затрат опустится ниже $0.50/миллион токенов, чтобы проверить, сможет ли доля перейти на новый уровень.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$2.22KДержатели:1
    0.00%
  • РК:$2.22KДержатели:1
    0.00%
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$0.1Держатели:0
    0.00%
  • Закрепить