Futures
Accédez à des centaines de contrats perpétuels
CFD
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Pre-IPOs
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Promotions
Centre d'activités
Participez et gagnez des récompenses
Parrainage
20 USDT
Invitez des amis et gagnez des récompenses
Programme d'affiliation
Obtenez des commissions exclusives
Gate Booster
Développez votre influence et gagnez des airdrops
Annoncement
Mises à jour en temps réel
Blog Gate
Articles sur le secteur de la crypto
AI
Gate AI
Votre assistant IA polyvalent pour toutes vos conversations
Gate AI Bot
Utilisez Gate AI directement dans votre application sociale
GateClaw
Gate Blue Lobster, prêt à l’emploi
Gate for AI Agent
Infrastructure IA, Gate MCP, Skills et CLI
Gate Skills Hub
+10K compétences
De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA
GateRouter
Choisissez intelligemment parmi plus de 40 modèles d’IA, avec 0 % de frais supplémentaires
Pourquoi le grand modèle ne peut-il pas générer « Ma Jiaqi » ? La recherche dans le vocabulaire complet de MiniMax a révélé qu'environ 5 % des tokens ont été oubliés lors de la formation ultérieure.
Selon le monitoring de Beating, MiniMax a publié un blog technique révélant le processus d’investigation derrière l’incapacité de leur modèle M2 de la série à produire le nom « 马嘉祺 » (Ma Jiaqi). L’enquête a débuté par un cas particulier, pour finalement révéler un problème systémique de dégradation affectant tout le vocabulaire.
La cause principale est que le tokenizer (le composant qui divise le texte en unités traitables par le modèle) a fusionné « 嘉祺 » en un token indépendant lors de l’entraînement. Lors de la phase de pré-entraînement, le modèle a vu une grande quantité de textes issus d’Internet, et a appris ce token ; mais dans les données de dialogue postérieures, moins de 5 exemples contenaient « 嘉祺 ». Au cours de cet entraînement supplémentaire, les vecteurs autour des tokens fréquemment mis à jour, comme tool_call ou les symboles de code, ont déformé l’espace vectoriel, repoussant des tokens peu fréquents comme « 嘉祺 » dans une mauvaise direction. Le modèle « connaît » toujours Ma Jiaqi et peut répondre précisément à des questions à son sujet, mais il a perdu la capacité de produire ce token en sortie.
L’équipe a ensuite effectué une analyse complète de l’ensemble du vocabulaire, comprenant environ 200 000 tokens, et a constaté que environ 4,9 % de ces tokens avaient subi une dégradation significative. La dégradation la plus grave concerne le japonais : 29,7 % des tokens japonais ont été fortement dégradés, bien au-delà des 3,3 % en coréen, 3,7 % en russe, 3,9 % en chinois et 3,5 % en anglais. Parmi les tokens les plus dégradés figurent aussi des mots-clés SEO comme « 传奇私服 » (serveur privé légendaire) ou « 无痛人流 » (avortement sans douleur), qui ont le même mécanisme de dégradation que « 嘉祺 ».
La gravité de la dégradation en japonais a également permis de résoudre une vieille énigme. Jusqu’ici, le modèle insérait occasionnellement des caractères russes ou coréens dans des dialogues en japonais, sans en connaître la cause. L’analyse montre que, suite à la dérive des paramètres des tokens japonais, ceux-ci se sont confondus avec ceux d’autres langues dans l’espace vectoriel, ce qui a entraîné à la fois une activation erronée des tokens japonais (mélange linguistique) et l’expulsion de tokens chinois peu fréquents hors de leur plage de probabilité normale (oubli de tokens).
La solution consiste à créer un jeu de données synthétiques couvrant tout le vocabulaire, permettant au modèle de s’entraîner à répéter chaque token de manière simple. Les résultats ont été immédiats : la proportion de caractères russes insérés dans les réponses en japonais est passée de 47 % à 1 %, et la stabilité des paramètres de sortie sur l’ensemble du vocabulaire (similarité cosinus) est passée de 0,329 au minimum à plus de 0,97 pour tous.