Acheter Cryptos

Payer en

USD

Acheter & Vendre

Visa, Mastercard, SEPA et bien plus

Trading flexible, zéro frais

Payez partout avec vos cryptos

Basique

Échangez des cryptos librement

Augmentez vos bénéfices grâce à l'effet de levier

Convertir & Auto-investir

Tradez n’importe quel volume sans frais ni slippage

Soyez facilement exposé à des positions à effet de levier

Trading Pre-Market

Tradez de nouveaux tokens avant le listing

Avancé

Effectuez des transactions on-chain avec Gate Wallet

Accès aux nouveaux tokens on-chain

Stratégies de trading automatisées

Suivez les experts

CrossEx Trading

Un seul solde de marge, partagé par toutes les plateformes

Accédez à des centaines de contrats perpétuels

Une plateforme pour les actifs mondiaux

Tradez des options classiques de style européen

Maximiser l'efficacité de votre capital

Introduction au trading futures

Préparez-vous à trader des contrats futurs

Événements futures

Participez aux événements et gagnez

Utiliser des fonds virtuels pour faire l'expérience du trading sans risque

Lancer

Collecte des candies pour obtenir des airdrops

Staking rapide, Gagnez de potentiels nouveaux jetons

Conservez des GT et recevez d'énormes airdrops gratuitement

Accédez à l'intégralité des introductions en bourse mondiales

Tradez on-chain et gagnez des airdrops

Gagnez des points Futures et réclamez vos récompenses d’airdrop.

Investissement

Gagner des intérêts avec des jetons inutilisés

Investissement automatique

Auto-invest régulier

Double investissement

Profitez de la volatilité du marché

Gagnez des récompenses grâce au staking flexible

Mettre en gage un crypto pour en emprunter une autre

Centre de prêts

Centre de prêts intégré

Gestion de patrimoine VIP

Plans premium de croissance

Gestion privée de patrimoine

Allocation premium d'actifs

Stratégies quantitatives

Stakez des cryptos pour gagner avec les produits PoS.

Effet de levier sans liquidation

Mint des GUSD pour des rendements RWA

Découvrir la valeur en crypto

Analyse en temps réel du marché des cryptomonnaies

Discutez avec des traders de cryptomonnaies

Ce qu'il se passe dans le monde de la crypto

Plus

Promotions

Centre d'activités

Participez et gagnez des récompenses

Invitez des amis et gagnez des récompenses

Programme d'affiliation

Obtenez des commissions exclusives

Développez votre influence et gagnez des airdrops

Mises à jour en temps réel

Articles sur le secteur de la crypto

Frais ultra-réduits

Gestion des actifs

Solution complète de gestion des actifs

Solutions d’actifs pour entreprises

Développeurs (API)

Connectez-vous à l'écosystème Gate

Virement Bancaire OTC

Dépôt et retrait fiat

Programme pour les Brokers

Mécanismes de remboursement API avantageux

AI

Votre assistant IA polyvalent pour toutes vos conversations

Utilisez Gate AI directement dans votre application sociale

Gate Blue Lobster, prêt à l’emploi

Gate for AI Agent

Infrastructure IA, Gate MCP, Skills et CLI

Gate Skills Hub

+10K compétences

De la bureautique au trading, une bibliothèque de compétences tout-en-un pour exploiter pleinement l’IA

Choisissez intelligemment parmi plus de 40 modèles d’IA, avec 0 % de frais supplémentaires

Autres

Trouver des FAQ et des guides d'aide

Apprenez à investir dans les cryptomonnaies

Grandir avec les champions

Preuve de réserves

Gate promet une preuve de réserves à 100 %

Assurez la sécurité de vos actifs

Pré-entrainement accéléré de 2 à 3 fois, la nouvelle solution TST de Nous suscite une controverse de « collision »

2026-05-17 04:00:22

Création du résumé en cours

ME News Actualités, le 14 mai (UTC+8), selon le monitoring de Dongcha Beating, Nous Research a publié un nouveau plan de pré-entraînement de grands modèles basé sur la superposition de tokens (TST).
Ce plan consiste à compresser et empaqueter les tokens adjacents en début d’entraînement, ce qui permet de réduire le temps de pré-entraînement de 2 à 3 fois pour une même charge de calcul.
TST comprend deux phases.
Dans les 20% à 40% initiaux de l’entraînement, le modèle ne lit plus les tokens un par un, mais « empaquette » les tokens adjacents en faisant la moyenne et les entre dans le modèle, puis prédit quels tokens seront dans le prochain paquet (sans tenir compte de l’ordre interne).
Ensuite, le modèle revient à la prédiction classique du token suivant.
Comme la structure de base n’est pas modifiée, le modèle produit lors de l’inférence est identique à un modèle standard.
Cette méthode a été validée sur un modèle MoE de 10 milliards de paramètres maximum.
L’essence de cette approche est « échanger de la puissance contre des données », en accélérant la consommation de corpus pour réduire le temps de calcul.
Si à l’avenir, le texte de haute qualité venait à s’épuiser, cette capacité à accélérer la consommation de données pourrait devenir un point faible.
De plus, quelques heures après la publication de l’article, un lecteur a souligné que le mécanisme de TST est très similaire à celui de l’ancien travail « Beyond Next Token Prediction » publié en 2024.
L’équipe d’auteurs a ensuite reconnu sur Hugging Face qu’il s’agissait d’un « recherche convergente malheureuse » et a promis de mettre à jour l’article avec une référence complémentaire.
(Source : BlockBeats)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
GateSquareMayTradingShare
1.93M Popularité
#
CLARITYActPassesSenateCommittee
3.57M Popularité
#
IsraelStrikesIranBTCPlunges
47.27K Popularité
#
#DailyPolymarketHotspot
973.42K Popularité
#
BitcoinVShapedReversalBack
227.15M Popularité

Épinglé