Futures
Accédez à des centaines de contrats perpétuels
CFD
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
CFD
Produits dérivés CFD sur actions américaines
US Stocks
Accédez à de véritables actions et ETF américains
HK Stocks
Tradez des actions des actions de qualité cotées à Hong Kong
Actions coréennes
SK Hynix
Tradez de véritables actions coréennes et investissez dans les actifs les plus populaires
Futures sur actions
Effet de levier élevé, trading 24h/24 et 7j/7
Actions tokenisées
Adossé à de véritables actions
IPO Access
Accédez à l'intégralité des introductions en bourse mondiales
GUSD
Mint GUSD pour des rendements de Treasury RWA
Activités boursières
Tradez des actions populaires et débloquez des airdrops généreux
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
IPO Access
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Promotions
Centre d'activités
Participez et gagnez des récompenses
Parrainage
20 USDT
Invitez des amis et gagnez des récompenses
Programme d'affiliation
Obtenez des commissions exclusives
Gate Booster
Développez votre influence et gagnez des airdrops
Annoncement
Mises à jour en temps réel
Blog Gate
Articles sur le secteur de la crypto
AI
Gate AI
Votre assistant IA polyvalent pour toutes vos conversations
Gate AI Bot
Utilisez Gate AI directement dans votre application sociale
GateClaw
Gate Blue Lobster, prêt à l’emploi
Gate for AI Agent
Infrastructure IA, Gate MCP, Skills et CLI
Gate Skills Hub
+10K compétences
De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA
Franchir le seuil des modèles de grande taille de plus de mille milliards de paramètres en apprentissage par renforcement : l'open source prime-rl permet à 28 serveurs d'entraîner 131k contextes
Les grands modèles pouvant lire des textes ultra-long de 256k ne sont pas rares, mais lors de l'entraînement en apprentissage par renforcement, afin que le modèle puisse effectuer des exercices de raisonnement par essais et erreurs de manière autonome, la mémoire vidéo doit conserver en permanence les valeurs d'activation intermédiaires volumineuses sur une longueur de 131k, ce qui entraîne une explosion des coûts de mémoire vidéo par centaines ou milliers de fois.
Auparavant, cela nécessitait un grand cluster de milliers de cartes graphiques, mais prime-rl 0.6.0 a permis à seulement 28 serveurs H200 d'exécuter l'entraînement RL en contexte 131k de GLM-5, avec un temps par étape contrôlé en moins de 5 minutes.
Pour résoudre le problème de tâches longues et rares comme la génération de code complexe, qui bloquent le rythme global en raison de leur durée, et causent une inactivité prolongée des ressources GPU, le cadre a rompu avec le mécanisme traditionnel d'attente synchrone, adoptant une architecture RL asynchrone complètement découplée.
Après le calcul des nouveaux poids, le formateur en arrière-plan n'a pas besoin d'attendre la fin des tâches d'essais et erreurs en cours, et peut directement déployer en temps réel les mises à jour pendant la génération de texte du modèle.
Les tâches déjà distribuées continuent d'utiliser l'ancienne stratégie pour garantir la vitesse, tandis que les nouvelles tâches injectent un cache KV-salé pour forcer la reconstruction du cache.
Pour éviter que la désynchronisation entre entraînement et inférence dans la mise à jour asynchrone ne cause une confusion logique du modèle, le cadre introduit la technologie de routage et de reproduction R3, traitant directement la distribution des experts au niveau inférieur, évitant ainsi la latence système causée par la conversion des données, et réduisant le désalignement entre les deux extrémités à un dixième, stabilisant grandement l'entraînement asynchrone.
En termes d'optimisation des ressources, le cadre a résolu de manière approfondie le problème de la saturation de la mémoire GPU par de longs textes grâce à une conception fine.
L'inférence adopte une architecture séparant lecture et écriture, empêchant un grand modèle de se bloquer lors de la lecture d'une grande quantité de contexte, ce qui pourrait interrompre la génération de texte suivante ;
il partage également la connaissance des experts entre plusieurs GPU, et utilise la technologie Mooncake pour assembler la mémoire et le disque inutilisés de plusieurs serveurs en un cache partagé.
Pour le calcul parallèle de textes ultra-longs, en tenant compte du mécanisme d'attention creuse DSA unique de GLM-5, le cadre a conçu une solution parallèle dédiée, garantissant que le modèle puisse avoir une vue d'ensemble tout en réduisant la communication de données entre chaque couche de GPU à une seule fois.
Du côté de l'entraînement, il combine DeepGEMM pour réaliser le entraînement en FP8 à mise à l'échelle par blocs proposé par DeepSeek V3, permettant d'utiliser la même précision et le même noyau de calcul pour l'entraînement et l'inférence, éliminant fondamentalement les crashs dus aux déviations de précision.
(Origine : BlockBeats)