Vercel:Обсяг викликів токенів DeepSeek перевищує OpenAI, вартість становить лише 1% від загальних витрат

robot
Генерація анотацій у процесі
ME AI Повідомлення, згідно з моніторингом Beating, Vercel опублікував індекс виробництва AI Gateway за червень 2026 року. Звіт показує, що завдяки запуску у травні серії DeepSeek V4 для Vercel Gateway (включаючи моделі Flash та Pro), частка трафіку токенів DeepSeek за місяць зросла з менш ніж 1% до 17%, обігнавши OpenAI (13%) і зайнявши третє місце. Однак через дуже низькі ціни всі витрати користувачів на DeepSeek становили лише близько 1% від загальних витрат на шлюз. Ціна є головною причиною швидкого зростання DeepSeek. Вартість входу та виходу мільйона токенів для DeepSeek V4 Flash становить лише 0,14 долара та 0,28 долара відповідно, що дешевше за аналогічні передові моделі Anthropic у 20-50 разів, а також у 8-12 разів дешевше за Qwen 3.6 Plus та Kimi K2.6. Оцінки показують, що продуктивність DeepSeek V4 відповідає стандартам, що сприяло швидкому розгортанню в виробництві командою розробників. Незважаючи на стрімке зростання трафіку низькозатратних моделей, у витратах домінують передові моделі. У травні витрати Anthropic зросли з 61% до 65%, при цьому у високорівневих сценаріях застосування, таких як генерація контенту, бекенд-інтелектуальні агенти та програмування, витрати становили від 70% до 80%. Наприклад, у сценарії програмних агентів DeepSeek забезпечив 49% трафіку токенів, але лише 4% витрат, тоді як Anthropic витратив 70% коштів при 28% трафіку. Команда розробників керує бюджетом за допомогою розумного маршрутизації, перенаправляючи високочастотні, низькоризикові задачі на дешевші моделі, використовуючи передові моделі лише у ключових моментах. Врахування показника повернення інвестицій (ROI) також уповільнює оновлення моделей. Наприклад, у травні Google випустила Gemini 3.5 Flash з ціною вищою за версію 3.0, що спричинило повільний перехід; наприкінці місяця 3.0 Flash все ще займав 90% трафіку серії Flash, тоді як 3.5 Flash — лише 7%. Одночасно, AI-агенти демонструють дуже високу щільність споживання токенів, витрачаючи понад половину токенів при чверті запитів. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено