Une accélération de 70 fois tout en conservant la qualité d'image, le cache KV + échantillonnage en peu d'étapes permettent à une seule carte de faire fonctionner un modèle de 14 milliards, cette méthode de distillation est vraiment impressionnante

Voir l'original
CoinNetwork
Nvidia ArtiFixer accélère de 70 fois : comble les zones mortes de la reconstruction 3D, la qualité d'image dépasse le SOTA de près de 3dB
NVIDIA et ETH Zurich ont lancé le cadre de reconstruction ArtiFixer3D lors du SIGGRAPH 2026.
En utilisant la distillation par correspondance de distribution, ils ont transformé un grand modèle vidéo bidirectionnel en un modèle autoregressif, améliorant la qualité de reconstruction et accélérant d'environ 70 fois, avec une qualité d'image supérieure de 1 à 3 dB par rapport aux références de pointe, et permettant la génération de plusieurs centaines de frames en une seule inférence grâce à la mise en cache KV et à une échantillonnage en peu d'étapes.
Lors du test sur une seule carte GB300, la version 14B a atteint 8,36 fps, et la version 1,3B a atteint 34,38 fps.
Trois variantes sont proposées pour optimiser la netteté et la cohérence ; lors du test en zone aveugle DL3DV, ArtiFixer3D+ a obtenu un PSNR de 20,15 dB, surpassant GenFusion d'environ 3,12 dB.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire