OpenRouter: Різниця в ШІ між Китаєм і США становить лише 3–6 місяців, моделі з відкритим кодом захоплюють світ.

OpenRouter називає кількох представників: DeepSeek V4 Flash за безцінь проникає в реальні агентські процеси, GLM 5.2 займає трон якості з першим місцем в рейтингу Artificial Analysis, а NVIDIA Nemotron 3 Ultra представляє повністю відкриту американську команду.
(Передісторія: Зворотний відлік кінця ери високих цін на ШІ? П’ять структурних причин, чому токени обов’язково подешевшають)
(Додатковий контекст: Anthropic повністю блокує Китай! Компаніям з китайським капіталом як у країні, так і за кордоном заборонено використовувати Claude, встановлено лінію національної безпеки)

Зміст статті

Toggle

  • DeepSeek збиває ціну до мінімуму
  • GLM займає трон якості
  • Американська команда: NVIDIA Nemotron 3 Ultra

Два роки тому трон відкритих ваг належав Llama від Meta. Сьогодні дані OpenRouter, найбільшого нейтрального маршрутизатора LLM у світі, показують: Llama повністю випала з рейтингу. Станом на травень 2026 року китайські моделі з відкритими вагами споживають близько 61% токенів на цій платформі, лише DeepSeek займає 17,6% за один тиждень.

За цим переворотом стоїть недооцінений факт: інтелект і здатності моделей з відкритими вагами стабільно відстають від передових американських лабораторій на три-шість місяців, і цей розрив не збільшується. Для будь-якої організації, яка дивиться на свої хмарні рахунки, перенесення робочого навантаження з передових моделей на відкриті ваги заощаджує реальні гроші.

DeepSeek збиває ціну до мінімуму

DeepSeek V4 Flash — це перша модель з відкритими вагами, яку команда безпосередньо кинула в реальні агентські процеси як заміну передовим моделям рівня Anthropic або OpenAI. Більша версія V4 Pro отримала 80,6% у SWE-bench Verified, що є найвищим показником серед відкритих ваг (SWE-bench Verified — це, простими словами, набір тестів, які перевіряють, чи вміє модель писати код, використовуючи реальні завдання з виправлення програм з GitHub).

DeepSeek V4-Pro

  • Вхідна плата без кешу: 0,30 долара США за мільйон токенів
  • Вхідна плата з кешем: 0,03 долара США за мільйон токенів
  • Вихідна плата: 0,50 долара США за мільйон токенів

DeepSeek R1 (Експерт з глибокого мислення та міркувань)

  • Вхідна плата без кешу: 0,55 долара США за мільйон токенів
  • Вхідна плата з кешем: 0,14 долара США за мільйон токенів
  • Вихідна плата: 2,19 долара США за мільйон токенів

DeepSeek V4-Flash (Найшвидший і найдешевший варіант)

  • Вхідна плата без кешу: 0,14 долара США за мільйон токенів
  • Вхідна плата з кешем: 0,0028 долара США за мільйон токенів
  • Вихідна плата: 0,28 долара США за мільйон токенів

Попадання в кеш означає: при повторному введенні однакового запиту або історії діалогу вхідна плата значно знижується на 70% до 90%.

GLM займає трон якості

Відкрита модель GLM 5.2, випущена z-ai в середині червня, посіла перше місце серед відкритих ваг за версією Intelligence Index v4.1 від стороннього оцінювача Artificial Analysis з 51 балом, випереджаючи Nemotron 3 Ultra (48 балів), MiniMax M3 та DeepSeek V4 Pro (44 бали), і лише приблизно на 5 балів поступаючись закритій Claude Fable 5. У більш реалістичному агентському тесті GDPval-AA вона приблизно на рівні GPT-5.5.

Її сильна сторона — планування. Архітектурний дизайн, рефакторинг цілих репозиторіїв, довготривалі агентські завдання — GLM 5.2 є найближчою портативною заміною стилю Opus. Ціна — вона дуже любить думати: середньозважена фактична ціна OpenRouter становить 0,447 долара США за мільйон токенів на вході та 3,31 долара США на виході.

Ще більш показовим є момент випуску. За кілька днів до появи GLM 5.2 США видали експортну директиву, яка змусила Anthropic широко припинити доступ до Fable 5 та Mythos 5, щоб запобігти доступу іноземних громадян. З одного боку — закриті моделі, які можуть бути раптово відключені через геополітику, з іншого — відкриті ваги з ліцензією MIT, близькі до передових, які кожен може розгорнути самостійно.

Американська команда: NVIDIA Nemotron 3 Ultra

Відкриті ваги походять не лише з Китаю. Нещодавно NVIDIA випустила Nemotron 3 Ultra, який отримав 48 балів у тому ж рейтингу, що робить його найсильнішою американською моделлю з відкритими вагами, поступаючись лише GLM 5.2.

550 мільярдів параметрів, 55 мільярдів активних, гібридна архітектура Mamba-2 та Transformer, ліцензія OpenMDW; простими словами, OpenMDW означає, що відкриваються не лише ваги, а й дані для навчання, рецепти та інструменти оцінювання. Розрахунок NVIDIA дуже прямий: чим більше використовуються відкриті моделі, тим більше продаються чіпи Blackwell, CUDA та корпоративні послуги для запуску цих моделей.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено