Vercel:Объем вызовов токенов DeepSeek превысил OpenAI, при этом стоимость составляет всего 1% от общих расходов

robot
Генерация тезисов в процессе
ME AI Сообщение, согласно мониторингу Beating, опубликован индекс производства AI Gateway Vercel за июнь 2026 года. Отчет показывает, что благодаря запуску серии DeepSeek V4 (включая модели Flash и Pro) на Vercel Gateway в мае, доля токенов DeepSeek за месяц выросла с менее 1% до 17%, превзойдя OpenAI (13%) и заняв третье место. Однако из-за очень низких цен все общие расходы пользователей на DeepSeek составили примерно 1% от общего финансирования Gateway. Цена является основной причиной быстрого взрыва популярности DeepSeek. Стоимость миллиона токенов входа и выхода DeepSeek V4 Flash составляет всего 0,14 и 0,28 долларов, что в 20–50 раз дешевле аналогичных передовых моделей Anthropic, а также в 8–12 раз ниже Qwen 3.6 Plus и Kimi K2.6. Оценки показывают, что производительность DeepSeek V4 соответствует требованиям, что побудило команду разработчиков быстро внедрять его в производство. Несмотря на резкий рост трафика низкобюджетных моделей, в расходах по-прежнему доминируют передовые модели. В мае доля расходов Anthropic увеличилась с 61% до 65%, при этом в сценариях генерации приложений, бэкэнд-агентов и программирования расходы составляли 70–80%. Например, в сценарии программных агентов DeepSeek обеспечил 49% трафика токенов, но только 4% затрат, тогда как Anthropic при 28% трафика потратил 70% средств. Команды разработчиков управляют бюджетом с помощью интеллектуального маршрутизации, перераспределяя задачи с высокой частотой и низким риском на модели с меньшей стоимостью, используя передовые модели только в ключевых узлах. Оценка возврата инвестиций (ROI) также замедлила обновление моделей. Например, в мае Google выпустила Gemini 3.5 Flash по более высокой цене, чем версия 3.0, что замедлило миграцию; к концу месяца 3.0 Flash все еще составлял 90% трафика серии Flash, а 3.5 Flash — всего 7%. В то же время, AI-агенты демонстрируют очень высокую плотность потребления токенов, расходуя более половины токенов при четверти запросов. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено