Futures
Accédez à des centaines de contrats perpétuels
TradFi
Or
Une plateforme pour les actifs mondiaux
Options
Hot
Tradez des options classiques de style européen
Compte unifié
Maximiser l'efficacité de votre capital
Trading démo
Introduction au trading futures
Préparez-vous à trader des contrats futurs
Événements futures
Participez aux événements et gagnez
Demo Trading
Utiliser des fonds virtuels pour faire l'expérience du trading sans risque
Lancer
CandyDrop
Collecte des candies pour obtenir des airdrops
Launchpool
Staking rapide, Gagnez de potentiels nouveaux jetons
HODLer Airdrop
Conservez des GT et recevez d'énormes airdrops gratuitement
Pre-IPOs
Accédez à l'intégralité des introductions en bourse mondiales
Points Alpha
Tradez on-chain et gagnez des airdrops
Points Futures
Gagnez des points Futures et réclamez vos récompenses d’airdrop.
Investissement
Simple Earn
Gagner des intérêts avec des jetons inutilisés
Investissement automatique
Auto-invest régulier
Double investissement
Profitez de la volatilité du marché
Staking souple
Gagnez des récompenses grâce au staking flexible
Prêt Crypto
0 Fees
Mettre en gage un crypto pour en emprunter une autre
Centre de prêts
Centre de prêts intégré
Je viens de voir qu'Intel a mis à disposition sur Hugging Face les versions quantifiées en INT4 des modèles vidéo Wan 2.2 d'Alibaba. C'est assez intéressant du point de vue de l'optimisation des modèles.
Fondamentalement, Intel a réussi à réduire la taille des poids de chaque modèle de manière significative. Chaque poids qui occupait 2 octets en BF16 ne prend maintenant que 0,5 octet après la quantification INT4. Cela signifie que la taille totale tombe à environ un quart de l'original. L'outil utilisé était AutoRound.
Les trois modèles libérés sont le T2V-A14B (texte vers vidéo), I2V-A14B (image vers vidéo) et TI2V-5B (entrée hybride texte et image). Les modèles A14B originaux fonctionnent en architecture MoE avec 27 milliards de paramètres au total, dont 14 milliards activés par étape. Sans la quantification INT4, ils nécessitent au moins 80 Go de VRAM par GPU juste pour travailler en résolution 720p.
Le plus pratique est le TI2V-5B, un modèle dense capable de faire tourner du 720p à 24 fps sur une GPU 4090 même dans sa forme originale. Imaginez avec l'optimisation INT4 appliquée.
Le détail important est qu'Intel n'a pas encore publié de benchmarks complets sur la consommation de VRAM ou la qualité visuelle après la quantification INT4. Cela dépendra d'une vérification par des tiers. Pour ceux qui veulent tester, Intel indique la branche vllm-omni comme option de déploiement, car ces modèles ne tournent pas sur le pipeline principal de vLLM.
C'est le genre d'optimisation qui rend ces modèles vidéo beaucoup plus accessibles à ceux qui ne disposent pas de matériel de pointe.