Google(GOOGL.US) обновила ценообразование API Gemini, основанное на поэтапной оплате по мере использования

robot
Генерация тезисов в процессе

Приложение Zhitoong Finance сообщает, что Google (GOOGL.US) недавно обновила тарифные категории для Gemini API; оптимальное решение и ценообразование основаны на фактических потребностях в использовании для вывода (inference).

В этот раз добавленные категории inference-сервисов включают: стандартный (Standard), гибкий (Flex), приоритетный (Priority), пакетный (Batch) и с кэшированием (Caching).

Google заявляет: «Gemini
API предоставляет различные механизмы оптимизации, которые позволяют достичь баланса между скоростью выполнения, стоимостью использования и стабильностью сервиса в зависимости от конкретных потребностей бизнес-нагрузки. Независимо от того, создаете ли вы чат-бота для реального времени или запускаете крупный автономный процесс обработки данных, выбор подходящего режима работы может существенно снизить затраты или повысить эффективность».

При этом категория гибкого вывода (Flex) использует незадействованные вычислительные ресурсы в непиковые часы, предоставляя скидку 50% к стандартной цене; целевая задержка составляет от 1 до 15 минут, но без гарантии задержки. Категория пакетного API (Batch) также предлагает скидку 50% к стандартным тарифам, а максимальная задержка может достигать 24 часов.

Тарифы категории с кэшированием рассчитываются исходя из количества кэшированных токенов (Token) и срока хранения; она рекомендуется для сценариев, таких как чат-боты с внедренными сложными системными инструкциями, повторный анализ длинных видеофайлов, а также запросы по крупным массивам документов.

Цена категории приоритета (Priority) на 75%–100% выше стандартной; задержку можно контролировать на уровне миллисекунд и секунд. Google рекомендует использовать эту категорию для сценариев вроде чат-ботов службы поддержки в реальном времени, обнаружения мошенничества в реальном времени и бизнес-критичных интеллектуальных помощников.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$2.26KДержатели:2
    0.07%
  • РК:$2.22KДержатели:1
    0.00%
  • РК:$2.23KДержатели:1
    0.00%
  • РК:$2.23KДержатели:0
    0.00%
  • Закрепить