Эта волна неявного кэширования Alibaba напрямую сократила расходы на восемь десятых, и долгосрочный агент с расширенным контекстом, наконец, нашёл решение своей дорогостоящей проблемы.

Посмотреть Оригинал
CoinNetwork
Бюллетень Coinjie сообщает, что команда 阿里qwen объявила о включении автоматического скрытого кэширования по умолчанию для флагманской модели qwen3.7-max на платформе Alibaba Cloud Bailing.
Разработчикам не нужно изменять код или указывать дополнительные параметры, чтобы напрямую воспользоваться снижением затрат на кэширование.
При новой системе тарификации система автоматически распознает и извлечет повторяющиеся префиксы контекста в запросах.
При попадании в кэш, стоимость входных токенов для совпавшей части будет взиматься только по 20% от исходной цены, что позволяет сэкономить 80% затрат на ввод.
Скрытое кэширование предназначено для снижения огромных затрат при работе с длинными текстами и сценариями интеллектуальных агентов.
Модель qwen3.7-max с окном контекста на 1 миллион токенов при выполнении сложных задач, таких как автономное кодирование, требует частого и повторного чтения больших кодовых баз или информационных документов.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено