Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Launchpad
Soyez les premiers à participer au prochain grand projet de jetons
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Google publie le guide de développement de la septième génération d'Ironwood TPU, détaillant l'optimisation des performances au niveau du système
Nouvelles ME : le 2 avril (UTC+8), Google a récemment publié un guide d’entraînement pour développeurs destiné à la septième génération d’Ironwood TPU. Ce guide vise à aider les développeurs à tirer pleinement parti des performances au niveau système d’Ironwood TPU, afin d’entraîner et de déployer efficacement des modèles d’IA de pointe. Ironwood TPU est une infrastructure d’IA sur mesure conçue pour répondre aux besoins en puissance de calcul des modèles à plusieurs billions de paramètres. Elle s’appuie notamment sur des technologies telles que les liaisons interpuces (ICI), les commutateurs d’échange de flux optiques (OCS), le réseau de centre de données (DCN) et la mémoire à bande passante élevée (HBM) agrégée, pour construire un système complet prenant en charge jusqu’à 9 216 puces. Le texte présente en détail plusieurs stratégies d’optimisation clés pour ce matériel, notamment : tirer parti de la prise en charge native des unités de multiplication matricielle (MXU) pour l’entraînement FP8 afin d’améliorer le débit ; utiliser la bibliothèque de noyaux JAX Tokamax, spécialement optimisée pour les TPU, qui traite les tenseurs irréguliers dans les modèles à long contexte et les modèles d’experts spécialisés grâce à « attention par éclaboussures » et « multiplication matricielle groupée Megablox » ; utiliser la 4e génération de cœurs clairsemés (SparseCore) pour décharger les opérations de communication collective afin de masquer la latence ; affiner le réglage de l’allocation de la mémoire SRAM rapide à puce des TPU (VMEM) afin de réduire la stagnation mémoire ; et, en fonction de la taille du modèle, de l’architecture et de la longueur de séquence, choisir la meilleure stratégie de partitionnement (comme FSDP, TP, EP). (Source : InFoQ)