Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Launchpad
Soyez les premiers à participer au prochain grand projet de jetons
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Google(GOOGL.US)met à jour la tarification de l'API Gemini : facturation par paliers en fonction de l'utilisation en inférence
L’application Zhitong Finance a appris que Google (GOOGL.US) a récemment mis à jour les paliers de facturation de l’API Gemini. Les options d’optimisation et les tarifs sont tous deux définis sur la base des besoins réels d’utilisation pour l’inférence.
Les nouveaux paliers de service d’inférence comprennent : Standard (Standard), Flex (Flex), Priority (Prioritaire), Batch (Traitement par lots) et Caching (Mise en cache).
Google indique : « L’API Gemini fournit plusieurs mécanismes d’optimisation qui permettent, selon les besoins spécifiques de la charge de travail de l’activité, d’atteindre un équilibre entre vitesse d’exécution, coût d’utilisation et stabilité du service. Qu’il s’agisse de mettre en place un robot de discussion en temps réel ou d’exécuter des processus de traitement de données hors ligne de grande envergure, choisir le bon mode d’exécution peut réduire de manière significative les coûts ou améliorer l’efficacité opérationnelle. »
Parmi eux, le palier d’inférence Flex exploite des ressources de calcul disponibles pendant les heures creuses (hors pic) et offre une réduction de 50 % par rapport au prix standard. Le délai cible est de 1 à 15 minutes, mais aucune garantie de délai n’est fournie. Le palier d’API Batch propose également une réduction de 50 % sur les tarifs standards, avec un délai pouvant aller jusqu’à 24 heures maximum.
Le palier Caching est facturé en fonction du nombre de tokens (mots) mis en cache et de la durée de stockage. Il est recommandé pour des robots de discussion intégrant des instructions système complexes, pour l’analyse répétée de fichiers vidéo longs, ainsi que pour des scénarios de requêtes sur de grands corpus de documents, etc.
Le prix du palier Prioritaire est supérieur de 75 % à 100 % au prix standard, et la latence peut être contrôlée à l’échelle des millisecondes jusqu’aux secondes. Google recommande ce palier pour des cas d’usage tels que des robots de service client en temps réel, la détection de fraude en temps réel et des assistants intelligents critiques pour l’activité, etc.