OpenRouter: Разрыв в области ИИ между Китаем и США составляет всего 3–6 месяцев, модели с открытым исходным кодом захватывают мир.

OpenRouter называет нескольких представителей: DeepSeek V4 Flash по сверхнизкой цене входит в реальные агентские процессы, GLM 5.2 занимает первое место по оценке Artificial Analysis, становясь королём качества, а NVIDIA Nemotron 3 Ultra представляет полностью открытую американскую команду.
(Предыстория: Обратный отсчёт до конца эры высоких цен на ИИ? Пять структурных причин неизбежного снижения стоимости токенов)
(Дополнительный фон: Anthropic полностью блокирует Китай! Всем компаниям с китайским капиталом, как внутри страны, так и за рубежом, запрещено использовать Claude, поднимая линию национальной безопасности)

Содержание статьи

Toggle

  • DeepSeek опускает цену до пола
  • GLM занимает трон качества
  • Американская команда: NVIDIA Nemotron 3 Ultra

Два года назад трон открытых весов принадлежал Meta Llama. Сегодня данные крупнейшего в мире нейтрального LLM-роутера OpenRouter показывают: Llama полностью выпала из рейтинга. По состоянию на май 2026 года китайские модели с открытыми весами потребляют около 61% токенов на этой платформе, причём только DeepSeek за неделю занимает 17,6%.

За этим переворотом стоит недооценённый факт: интеллект и способности моделей с открытыми весами стабильно отстают от передовых американских лабораторий на три-шесть месяцев, и этот разрыв не увеличивается. Для любой организации, которая разворачивает счета за облако, перенос рабочих нагрузок с передовых моделей на открытые веса экономит реальные деньги.

DeepSeek опускает цену до пола

DeepSeek V4 Flash — первая модель с открытыми весами, которую команда напрямую бросила в реальные агентские процессы в качестве замены передовым моделям, таким как Anthropic или OpenAI. Более крупная версия V4 Pro набрала 80,6% в SWE-bench Verified, что является наивысшим показателем среди открытых весов (SWE-bench Verified — это, простыми словами, набор тестов, использующих реальные задачи исправления кода из GitHub для оценки умения модели писать код).

DeepSeek V4-Pro

  • Стоимость ввода при промахе кэша: $0,30 за миллион токенов
  • Стоимость ввода при попадании в кэш: $0,03 за миллион токенов
  • Стоимость вывода: $0,50 за миллион токенов

DeepSeek R1 (Эксперт по глубокому рассуждению и мышлению)

  • Стоимость ввода при промахе кэша: $0,55 за миллион токенов
  • Стоимость ввода при попадании в кэш: $0,14 за миллион токенов
  • Стоимость вывода: $2,19 за миллион токенов

DeepSeek V4-Flash (Лучший выбор для максимальной скорости и низкой стоимости)

  • Стоимость ввода при промахе кэша: $0,14 за миллион токенов
  • Стоимость ввода при попадании в кэш: $0,0028 за миллион токенов
  • Стоимость вывода: $0,28 за миллион токенов

Попадание в кэш означает: при повторном вводе того же промпта или истории диалога стоимость ввода значительно снижается на 70%–90%.

GLM занимает трон качества

Открытая модель GLM 5.2, выпущенная z-ai в середине июня, заняла первое место среди открытых весов в Intelligence Index v4.1 от стороннего оценщика Artificial Analysis с 51 баллом, опережая Nemotron 3 Ultra (48 баллов), MiniMax M3 и DeepSeek V4 Pro (44 балла), и уступая лишь закрытой Claude Fable 5 примерно на 5 баллов. В более приближённом к реальности агентском тесте GDPval-AA она примерно на уровне GPT-5.5.

Её сильная сторона — планирование. Архитектурное проектирование, рефакторинг всего репозитория, долгосрочные агентские задачи — GLM 5.2 в настоящее время является наиболее близкой к стилю Opus переносимой заменой. Цена — она любит думать: средневзвешенная фактическая стоимость на OpenRouter составляет $0,447 за миллион токенов на ввод и $3,31 на вывод.

Ещё более интригующим является timing. За несколько дней до появления GLM 5.2 США ввели экспортные ограничения, заставив Anthropic широко отключить Fable 5 и Mythos 5, чтобы предотвратить доступ иностранных граждан. С одной стороны — закрытые модели, которые могут быть отключены в любой момент из-за геополитики, с другой — открытые веса под лицензией MIT, близкие к передовым, которые любой может развернуть самостоятельно.

Американская команда: NVIDIA Nemotron 3 Ultra

Открытые веса производятся не только в Китае. NVIDIA недавно выпустила Nemotron 3 Ultra, который набрал 48 баллов в том же рейтинге, став сильнейшей американской моделью с открытыми весами, уступая лишь GLM 5.2.

550 миллиардов параметров, 55 миллиардов активных, гибридная архитектура Mamba-2 и Transformer, лицензия OpenMDW. OpenMDW простыми словами означает, что открыты не только веса, но и обучающие данные, рецепты и инструменты оценки. Расчёт NVIDIA прост: чем больше используются открытые модели, тем больше продаётся их чипов Blackwell, CUDA и корпоративных услуг.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено