Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Launchpad
Будьте готовы к следующему крупному токен-проекту
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Google(GOOGL.US) обновила ценообразование API Gemini, основанное на поэтапной оплате по мере использования
Приложение Zhitoong Finance сообщает, что Google (GOOGL.US) недавно обновила тарифные категории для Gemini API; оптимальное решение и ценообразование основаны на фактических потребностях в использовании для вывода (inference).
В этот раз добавленные категории inference-сервисов включают: стандартный (Standard), гибкий (Flex), приоритетный (Priority), пакетный (Batch) и с кэшированием (Caching).
Google заявляет: «Gemini
API предоставляет различные механизмы оптимизации, которые позволяют достичь баланса между скоростью выполнения, стоимостью использования и стабильностью сервиса в зависимости от конкретных потребностей бизнес-нагрузки. Независимо от того, создаете ли вы чат-бота для реального времени или запускаете крупный автономный процесс обработки данных, выбор подходящего режима работы может существенно снизить затраты или повысить эффективность».
При этом категория гибкого вывода (Flex) использует незадействованные вычислительные ресурсы в непиковые часы, предоставляя скидку 50% к стандартной цене; целевая задержка составляет от 1 до 15 минут, но без гарантии задержки. Категория пакетного API (Batch) также предлагает скидку 50% к стандартным тарифам, а максимальная задержка может достигать 24 часов.
Тарифы категории с кэшированием рассчитываются исходя из количества кэшированных токенов (Token) и срока хранения; она рекомендуется для сценариев, таких как чат-боты с внедренными сложными системными инструкциями, повторный анализ длинных видеофайлов, а также запросы по крупным массивам документов.
Цена категории приоритета (Priority) на 75%–100% выше стандартной; задержку можно контролировать на уровне миллисекунд и секунд. Google рекомендует использовать эту категорию для сценариев вроде чат-ботов службы поддержки в реальном времени, обнаружения мошенничества в реальном времени и бизнес-критичных интеллектуальных помощников.