Hugging Face CEO Clem Delangue anuncia el lanzamiento oficial de Kernels en Hub, optimizando los operadores de GPU para acelerar la inferencia y el entrenamiento entre 1.7 y 2.5 veces, y simplificando el proceso de instalación. Kernels Hub trasladará la compilación a la nube, soportando múltiples hardware y versiones de operadores, actualmente con 61 operadores precompilados, compatibles con el marco de inferencia de Hugging Face.

MeNews

2026-04-15 05:21:18

Generación de resúmenes en curso

Noticias de ME News, 15 de abril (UTC+8), según la monitorización de 1M AI News, el CEO de Hugging Face, Clem Delangue, anunció que Kernels está oficialmente en línea en Hub.
Los operadores de GPU son códigos de optimización de bajo nivel que permiten que las tarjetas gráficas alcancen velocidades extremas, acelerando la inferencia y el entrenamiento entre 1.7 y 2.5 veces, pero la instalación siempre ha sido una pesadilla: tomando como ejemplo el más común FlashAttention, la compilación local requiere aproximadamente 96 GB de memoria y varias horas, y una pequeña diferencia en la versión de PyTorch o CUDA provoca errores, la mayoría de los desarrolladores se quedan atascados en este paso.
Kernels Hub traslada la compilación a la nube.
Hugging Face compila previamente los operadores en diferentes entornos de tarjetas gráficas y sistemas, los desarrolladores solo necesitan escribir una línea de código, y Hub automáticamente ajusta a la hardware, descargando archivos precompilados en segundos y listos para usar.
El mismo proceso puede cargar múltiples versiones diferentes de operadores, siendo compatible con torch.compile.
Kernels fue probado y lanzado en junio del año pasado, y este mes se actualizó a un nivel de repositorio Hub de primer nivel, junto a Models, Datasets y Spaces.
Actualmente cuenta con 61 operadores precompilados, cubriendo escenarios comunes como mecanismos de atención, normalización, enrutamiento de expertos híbridos, cuantización, entre otros, soportando plataformas de aceleración de hardware como CUDA de Nvidia, ROCm de AMD, Metal de Apple y XPU de Intel, y ya está integrado en el marco de inferencia TGI y la biblioteca Transformers de Hugging Face.
(Origen: BlockBeats)

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
GatePreIPOsLaunchesWithSpaceX
111.97K Popularidad
#
GateMarchTransparencyReport
38.15K Popularidad
#
IsraelStrikesIranBTCPlunges
29.69K Popularidad
#
GoldmanSachsFilesBitcoinIncomeETF
772.94K Popularidad
#
USBlocksStraitofHormuz
745.6K Popularidad

Anclado

Hugging Face lanza oficialmente Kernels, los operadores de GPU como modelos, listos con una línea de código

Temas de actualidad

GatePreIPOsLaunchesWithSpaceX

GateMarchTransparencyReport

IsraelStrikesIranBTCPlunges

GoldmanSachsFilesBitcoinIncomeETF

USBlocksStraitofHormuz

Anclado