OpenRouter называет нескольких представителей: DeepSeek V4 Flash по сверхнизкой цене входит в реальные агентские процессы, GLM 5.2 занимает первое место по оценке Artificial Analysis, становясь королём качества, а NVIDIA Nemotron 3 Ultra представляет полностью открытую американскую команду.
(Предыстория: Обратный отсчёт до конца эры высоких цен на ИИ? Пять структурных причин неизбежного снижения стоимости токенов)
(Дополнительный фон: Anthropic полностью блокирует Китай! Всем компаниям с китайским капиталом, как внутри страны, так и за рубежом, запрещено использовать Claude, поднимая линию национальной безопасности)

Содержание статьи

Toggle

DeepSeek опускает цену до пола
GLM занимает трон качества
Американская команда: NVIDIA Nemotron 3 Ultra

Два года назад трон открытых весов принадлежал Meta Llama. Сегодня данные крупнейшего в мире нейтрального LLM-роутера OpenRouter показывают: Llama полностью выпала из рейтинга. По состоянию на май 2026 года китайские модели с открытыми весами потребляют около 61% токенов на этой платформе, причём только DeepSeek за неделю занимает 17,6%.

За этим переворотом стоит недооценённый факт: интеллект и способности моделей с открытыми весами стабильно отстают от передовых американских лабораторий на три-шесть месяцев, и этот разрыв не увеличивается. Для любой организации, которая разворачивает счета за облако, перенос рабочих нагрузок с передовых моделей на открытые веса экономит реальные деньги.

DeepSeek опускает цену до пола

DeepSeek V4 Flash — первая модель с открытыми весами, которую команда напрямую бросила в реальные агентские процессы в качестве замены передовым моделям, таким как Anthropic или OpenAI. Более крупная версия V4 Pro набрала 80,6% в SWE-bench Verified, что является наивысшим показателем среди открытых весов (SWE-bench Verified — это, простыми словами, набор тестов, использующих реальные задачи исправления кода из GitHub для оценки умения модели писать код).

DeepSeek V4-Pro

Стоимость ввода при промахе кэша: $0,30 за миллион токенов
Стоимость ввода при попадании в кэш: $0,03 за миллион токенов
Стоимость вывода: $0,50 за миллион токенов

DeepSeek R1 (Эксперт по глубокому рассуждению и мышлению)

Стоимость ввода при промахе кэша: $0,55 за миллион токенов
Стоимость ввода при попадании в кэш: $0,14 за миллион токенов
Стоимость вывода: $2,19 за миллион токенов

DeepSeek V4-Flash (Лучший выбор для максимальной скорости и низкой стоимости)

Стоимость ввода при промахе кэша: $0,14 за миллион токенов
Стоимость ввода при попадании в кэш: $0,0028 за миллион токенов
Стоимость вывода: $0,28 за миллион токенов

Попадание в кэш означает: при повторном вводе того же промпта или истории диалога стоимость ввода значительно снижается на 70%–90%.

GLM занимает трон качества

Открытая модель GLM 5.2, выпущенная z-ai в середине июня, заняла первое место среди открытых весов в Intelligence Index v4.1 от стороннего оценщика Artificial Analysis с 51 баллом, опережая Nemotron 3 Ultra (48 баллов), MiniMax M3 и DeepSeek V4 Pro (44 балла), и уступая лишь закрытой Claude Fable 5 примерно на 5 баллов. В более приближённом к реальности агентском тесте GDPval-AA она примерно на уровне GPT-5.5.

Её сильная сторона — планирование. Архитектурное проектирование, рефакторинг всего репозитория, долгосрочные агентские задачи — GLM 5.2 в настоящее время является наиболее близкой к стилю Opus переносимой заменой. Цена — она любит думать: средневзвешенная фактическая стоимость на OpenRouter составляет $0,447 за миллион токенов на ввод и $3,31 на вывод.

Ещё более интригующим является timing. За несколько дней до появления GLM 5.2 США ввели экспортные ограничения, заставив Anthropic широко отключить Fable 5 и Mythos 5, чтобы предотвратить доступ иностранных граждан. С одной стороны — закрытые модели, которые могут быть отключены в любой момент из-за геополитики, с другой — открытые веса под лицензией MIT, близкие к передовым, которые любой может развернуть самостоятельно.

Американская команда: NVIDIA Nemotron 3 Ultra

Открытые веса производятся не только в Китае. NVIDIA недавно выпустила Nemotron 3 Ultra, который набрал 48 баллов в том же рейтинге, став сильнейшей американской моделью с открытыми весами, уступая лишь GLM 5.2.

550 миллиардов параметров, 55 миллиардов активных, гибридная архитектура Mamba-2 и Transformer, лицензия OpenMDW. OpenMDW простыми словами означает, что открыты не только веса, но и обучающие данные, рецепты и инструменты оценки. Расчёт NVIDIA прост: чем больше используются открытые модели, тем больше продаётся их чипов Blackwell, CUDA и корпоративных услуг.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
SKHynixTopsKOSPIByMarketCap
1,64M Популярность
#
MicronEarningsBeatExpectationsSharesRise
354,15K Популярность
#
IsraelStrikesIranBTCPlunges
65,31K Популярность
#
PredictWorldCupShare20000U
129,14K Популярность
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
196,24K Популярность

Закреплено

Карта сайта

OpenRouter: Разрыв в области ИИ между Китаем и США составляет всего 3–6 месяцев, модели с открытым исходным кодом захватывают мир.

DeepSeek опускает цену до пола

GLM занимает трон качества

Американская команда: NVIDIA Nemotron 3 Ultra

Популярные темы

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

USMayPCEInflationRisesTo4.1%HighestIn3Years

Закреплено