Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
TradFi
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Pre-IPOs
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
Acabo de ver que Intel ha puesto a disposición en Hugging Face las versiones cuantizadas en INT4 de los modelos de vídeo Wan 2.2 de Alibaba. Esto es bastante interesante desde el punto de vista de optimización de modelos.
Básicamente, Intel logró reducir significativamente el tamaño de los pesos de cada modelo. Cada peso que ocupaba 2 bytes en BF16 ahora ocupa solo 0,5 bytes después de la cuantización INT4. Esto significa que el tamaño total cae aproximadamente a una cuarta parte del original. La herramienta utilizada fue AutoRound.
Los tres modelos liberados son el T2V-A14B (texto a vídeo), I2V-A14B (imagen a vídeo) y TI2V-5B (entrada híbrida de texto e imagen). Los modelos A14B originales funcionan con arquitectura MoE con 27 mil millones de parámetros totales, siendo 14 mil millones activados por paso. Sin la cuantización INT4, requieren al menos 80GB de VRAM por GPU solo para trabajar con resolución 720p.
Lo más práctico es el TI2V-5B, un modelo denso que puede correr a 720p a 24fps en una GPU 4090 incluso en su forma original. Imagínate con la optimización INT4 aplicada.
El detalle importante es que Intel aún no ha divulgado benchmarks completos sobre consumo de VRAM o calidad visual tras la cuantización INT4. Dependerá de verificaciones por terceros. Para quienes quieran probar, Intel señala la rama vllm-omni como la opción de implementación, ya que estos modelos no funcionan en el pipeline principal de vLLM.
Es el tipo de optimización que hace estos modelos de vídeo mucho más accesibles para quienes no tienen hardware de punta.