Аналіз: розрив між китайськими та американськими open-source великими моделями та закритими передовими моделями становить лише від 3 до 6 місяців, надзвичайно низька вартість прискорює глобальну хвилю заміни.

robot
Генерація анотацій у процесі

За даними моніторингу Beating, агрегатор OpenRouter повідомив, що розрив у продуктивності між відкритими моделями та закритими передовими моделями стабілізувався на рівні від 3 до 6 місяців. За останні 18 місяців передові закриті лабораторії не змогли, як очікувалося, відірватися, тоді як відкриті сили, представлені новими гравцями з Китаю та США, прискорюють заміну закритих моделей завдяки надзвичайно високому співвідношенню ціни та якості.

DeepSeek V4 Flash, випущений лише два місяці тому, став першим вибором для заміни. Модель DeepSeek V4 Flash з 284 мільярдами параметрів досягла результату 79,0% у тесті SWE-bench Verified, що близько до рівня GPT-5.5. Офіційна ціна введення/виведення від першоджерела становить лише 0,14/0,28 долара за мільйон токенів, а вартість виведення приблизно в 150 разів дешевша, ніж у GPT-5.5. Навіть з урахуванням націнки за західне хмарне розміщення без збереження даних для навчання, фактична вартість становить лише близько 1,3% від вартості передових закритих моделей.

Окрім цінової переваги, GLM 5.2, випущений у червні 2026 року компанією Zhipu, посідає перше місце в індексі відкритих ваг штучного інтелекту Artificial Analysis і в тестах реальних агентів дорівнює рівню GPT-5.5, ставши альтернативою для довгострокового планування програмування. Однак GLM 5.2 витрачає більше токенів під час глибокого мислення, тому при розгортанні на підприємствах необхідно балансувати вартість виведення. Багатомодальна відкрита модель MiniMax M3 завдяки інноваційній розрідженій архітектурі уваги MSA пропонує можливості обробки довгого контексту для нативних зображень і відео за низькою ціною токенів, ставши сильним відкритим конкурентом Gemini Flash.

Водночас Nemotron 3 Ultra від NVIDIA на основі гібридної архітектури Mamba-2 стала найсильнішою американською відкритою силою, яка має на меті стимулювати ринковий попит на апаратне забезпечення та мікросервісну екосистему NVIDIA через відкриту екосистему.

OpenRouter підкреслює, що хоча передові закриті моделі врешті-решт продовжуватимуть рухатися вперед, вартість токенів при фіксованому рівні інтелекту продовжуватиме знижуватися, що забезпечує підприємствам значний простір для оптимізації витрат.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено