Huawei annonce la solution complète d'infrastructure de données AI DC

robot
Création du résumé en cours
Mars Finance News 22 mai – Huawei a officiellement lancé la solution d'infrastructure de données AI DC en pile complète, le stockage distribué tout-flash OceanStor Pacific avec une capacité de 11PB/2U, leader dans l'industrie en termes de densité de haute capacité, réalisant un TCO optimal pour le stockage de données massives.
Conçue pour les scénarios de clusters d'inférence à très grande échelle, Huawei a lancé le premier stockage de mémoire contextuelle supportant une puissance de calcul hétérogène, le CMS (Context Memory Storage), supportant la transmission directe de la sémantique KV ou utilisant un DPU dédié pour le déchargement sémantique, pouvant s'étendre à un pool de cache KV partagé de niveau PB, réduisant le délai du premier token d'inférence de 90%.
Pour les scénarios d'inférence AI d'entreprise, Huawei a innové avec la plateforme de données AI « 3+1 », intégrant une base de connaissances avec plus de 95% de précision de recherche, un cache KV accéléré et une mémoire en évolution continue, gérée par la technologie UCM pour la planification et la gestion, améliorant la précision de l'inférence de 30%.
(Observation à large angle)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 12
  • 1
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
ColdBrewYield
· Il y a 2h
Huawei, cette solution full-stack, connecte le contexte du stockage et de la calcul, et la substitution nationale progresse encore davantage.
Voir l'originalRépondre0
GateUser-8ca669fd
· Il y a 3h
La plateforme 3+1 avec cette précision de recherche de 95 %, devrait permettre aux entreprises de réduire considérablement les pièges lors de leur mise en œuvre.
Voir l'originalRépondre0
YieldYeti
· Il y a 3h
Poolage partagée du cache KV, l'efficacité de l'inférence multi-GPU peut être considérablement améliorée.
Voir l'originalRépondre0
PineNeedlesAndColdWind
· Il y a 3h
DPU décharge la sémantique KV, optimisation au niveau matériel, les perfectionnistes sont ravis
Voir l'originalRépondre0
MevTeaTime
· Il y a 3h
L'exactitude du raisonnement de l'entreprise s'améliore de 30 %, le ROI de la mise en œuvre est rentable
Voir l'originalRépondre0
OldKeyboardTraitor
· Il y a 3h
Le point de l'évolution continue de la mémoire semble être en train de créer une mémoire à long terme.
Voir l'originalRépondre0
0xSideQuest
· Il y a 3h
Attendre des cas de déploiement réels, les paramètres techniques sont beaux, mais l'ingénierie est la véritable épreuve
Voir l'originalRépondre0
NekoOnCall
· Il y a 3h
OceanStor Pacific ce nom sonne puissant, tout en flash + distribué, une bête de performance
Voir l'originalRépondre0
NeonVortexTunnel
· Il y a 3h
La gestion du contexte pour des clusters de très grande taille a toujours été un point sensible, et CMS constitue une solution ciblée.
Voir l'originalRépondre0
Frost-ColoredCubeCity
· Il y a 3h
De la formation à l'inférence, une couverture complète de bout en bout, l'ambition de l'infrastructure AI de Huawei n'est pas petite
Voir l'originalRépondre0
Afficher plus
  • Épinglé