Анализ: разрыв между открытыми и закрытыми передовыми моделями Китая и США составляет всего 3-6 месяцев, крайне низкая стоимость ускоряет глобальную волну замещений.

robot
Генерация тезисов в процессе

По данным мониторинга Beating, агрегатор услуг OpenRouter сообщает, что разрыв в производительности между открытыми моделями и закрытыми передовыми моделями стабилизировался на уровне от 3 до 6 месяцев. За последние 18 месяцев передовые закрытые лаборатории не смогли, как ожидалось, оторваться, в то время как открытые силы, представленные новыми игроками из Китая и США, ускоряют замену закрытых моделей благодаря высокой экономической эффективности.

Всего через два месяца после выпуска DeepSeek V4 Flash стал предпочтительным вариантом замены. DeepSeek V4 Flash с 284 миллиардами параметров показал результат 79,0% в тесте SWE-bench Verified, приблизившись к уровню GPT-5.5. Официальные цены на вход/выход от первого лица составляют всего 0,14/0,28 доллара за миллион токенов, что делает стоимость вывода примерно в 150 раз дешевле, чем у GPT-5.5. Даже с учетом наценки за западное облачное хостинг, не сохраняющее данные для обучения, фактическая стоимость составляет лишь около 1,3% от стоимости передовых закрытых моделей.

Помимо ценового преимущества, GLM 5.2, выпущенный Zhipu в июне 2026 года, занял первое место в индексе открытых весов Artificial Analysis и в тестах реальных агентов сравнялся с уровнем GPT-5.5, став альтернативой для долгосрочного планирования программирования. Однако GLM 5.2 потребляет много токенов при глубоком анализе, поэтому при развертывании на предприятиях необходимо балансировать стоимость вывода. Мультимодальная открытая модель MiniMax M3, использующая инновационную архитектуру MSA с разреженным вниманием, обеспечивает обработку длинных контекстов для нативных изображений и видео по низкой цене токенов, становясь сильным конкурентом Gemini Flash с открытым исходным кодом.

В то же время Nemotron 3 Ultra от NVIDIA на основе гибридной архитектуры Mamba-2 стал сильнейшей открытой силой в США, стремясь через открытую экосистему стимулировать рыночный спрос на аппаратное обеспечение NVIDIA и микросервисы.

OpenRouter подчеркивает, что, хотя передовые закрытые модели в конечном итоге будут продвигаться вперед, стоимость токенов при фиксированном уровне интеллекта будет продолжать снижаться, предоставляя предприятиям значительные возможности для оптимизации затрат.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено