Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Pre-IPOs
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Promotions
Centre d'activités
Participez et gagnez des récompenses
Parrainage
20 USDT
Invitez des amis et gagnez des récompenses
Programme d'affiliation
Obtenez des commissions exclusives
Gate Booster
Développez votre influence et gagnez des airdrops
Annoncement
Mises à jour en temps réel
Blog Gate
Articles sur le secteur de la crypto
AI
Gate AI
Votre assistant IA polyvalent pour toutes vos conversations
Gate AI Bot
Utilisez Gate AI directement dans votre application sociale
GateClaw
Gate Blue Lobster, prêt à l’emploi
Gate for AI Agent
Infrastructure IA, Gate MCP, Skills et CLI
Gate Skills Hub
+10K compétences
De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA
GateRouter
Choisissez intelligemment parmi plus de 30 modèles d’IA, avec 0 % de frais supplémentaires
Les chercheurs de DeepMind supposent que le retard de DeepSeek V4 est dû au doublement des données d'entraînement à 33 To, ce qui a provoqué une instabilité grave
Selon le suivi Beating, le rapport technique de DeepSeek V4 révèle que V4-Flash et V4-Pro ont été pré-entraînés respectivement sur 32T et 33T de tokens, soit le double par rapport à environ 15T tokens pour V3.
Le rapport admet que lors de l’entraînement, « des défis importants d’instabilité ont été rencontrés », avec des pics de perte (loss spike) récurrents, la cause étant des valeurs aberrantes dans la couche MoE, le mécanisme de routage lui-même aggravant ces anomalies, un simple rollback ne pouvant pas résoudre le problème.
DeepSeek a identifié deux solutions déjà appliquées à l’entraînement réel : Anticipatory Routing (routage anticipatif), qui délie le calcul de l’index de routage de la mise à jour du réseau principal, déclenché automatiquement uniquement en cas de loss spike, avec un coût supplémentaire d’environ 20 % ; SwiGLU Clamping, qui limite les valeurs d’activation à une plage fixe pour supprimer directement les valeurs aberrantes.
Le rapport indique que ces deux méthodes sont efficaces, mais admet que « les principes fondamentaux ne sont pas encore entièrement compris ».
Le chercheur de Google DeepMind Susan Zhang (ayant travaillé chez Meta AI et OpenAI) a commenté que l’instabilité provoquée par le doublement des données d’entraînement « explique le retard », qualifiant ces deux solutions de « pansements », tout en saluant la transparence technologique de DeepSeek.