Futures
Accédez à des centaines de contrats perpétuels
CFD
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Pre-IPOs
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Promotions
Centre d'activités
Participez et gagnez des récompenses
Parrainage
20 USDT
Invitez des amis et gagnez des récompenses
Programme d'affiliation
Obtenez des commissions exclusives
Gate Booster
Développez votre influence et gagnez des airdrops
Annoncement
Mises à jour en temps réel
Blog Gate
Articles sur le secteur de la crypto
AI
Gate AI
Votre assistant IA polyvalent pour toutes vos conversations
Gate AI Bot
Utilisez Gate AI directement dans votre application sociale
GateClaw
Gate Blue Lobster, prêt à l’emploi
Gate for AI Agent
Infrastructure IA, Gate MCP, Skills et CLI
Gate Skills Hub
+10K compétences
De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA
GateRouter
Choisissez intelligemment parmi plus de 40 modèles d’IA, avec 0 % de frais supplémentaires
Pré-entrainement accéléré de 2 à 3 fois, la nouvelle solution TST de Nous suscite une controverse de « collision »
ME News Actualités, le 14 mai (UTC+8), selon le monitoring de Dongcha Beating, Nous Research a publié un nouveau plan de pré-entraînement de grands modèles basé sur la superposition de tokens (TST).
Ce plan consiste à compresser et empaqueter les tokens adjacents en début d’entraînement, ce qui permet de réduire le temps de pré-entraînement de 2 à 3 fois pour une même charge de calcul.
TST comprend deux phases.
Dans les 20% à 40% initiaux de l’entraînement, le modèle ne lit plus les tokens un par un, mais « empaquette » les tokens adjacents en faisant la moyenne et les entre dans le modèle, puis prédit quels tokens seront dans le prochain paquet (sans tenir compte de l’ordre interne).
Ensuite, le modèle revient à la prédiction classique du token suivant.
Comme la structure de base n’est pas modifiée, le modèle produit lors de l’inférence est identique à un modèle standard.
Cette méthode a été validée sur un modèle MoE de 10 milliards de paramètres maximum.
L’essence de cette approche est « échanger de la puissance contre des données », en accélérant la consommation de corpus pour réduire le temps de calcul.
Si à l’avenir, le texte de haute qualité venait à s’épuiser, cette capacité à accélérer la consommation de données pourrait devenir un point faible.
De plus, quelques heures après la publication de l’article, un lecteur a souligné que le mécanisme de TST est très similaire à celui de l’ancien travail « Beyond Next Token Prediction » publié en 2024.
L’équipe d’auteurs a ensuite reconnu sur Hugging Face qu’il s’agissait d’un « recherche convergente malheureuse » et a promis de mettre à jour l’article avec une référence complémentaire.
(Source : BlockBeats)