Huawei a officiellement lancé une solution complète d'infrastructure de données AI DC, le stockage distribué entièrement flash OceanStor Pacific atteignant 11PB/2U, avec une haute densité, un TCO plus faible, supportant le traitement de volumes massifs de données. Pour les clusters d'inférence à très grande échelle, une mémoire de contexte de calcul hétérogène CMS a été introduite, supportant une communication directe sémantique KV ou un déchargement DPU, pouvant être étendue à un pool de cache KV partagé de niveau PB, avec une réduction de 90 % du délai du premier jeton. Destinée à l'inférence AI d'entreprise, une plateforme de données AI 3+1 a été proposée, intégrant une base de connaissances avec une précision de recherche d'environ 95 %, un cache KV accéléré et une mémoire en évolution continue, gérée par UCM, améliorant la précision de l'inférence d'environ 30 %.

MarsBitNews

2026-05-22 06:03:48

Création du résumé en cours

Mars Finance News 22 mai – Huawei a officiellement lancé la solution d'infrastructure de données AI DC en pile complète, le stockage distribué tout-flash OceanStor Pacific avec une capacité de 11PB/2U, leader dans l'industrie en termes de densité de haute capacité, réalisant un TCO optimal pour le stockage de données massives.
Conçue pour les scénarios de clusters d'inférence à très grande échelle, Huawei a lancé le premier stockage de mémoire contextuelle supportant une puissance de calcul hétérogène, le CMS (Context Memory Storage), supportant la transmission directe de la sémantique KV ou utilisant un DPU dédié pour le déchargement sémantique, pouvant s'étendre à un pool de cache KV partagé de niveau PB, réduisant le délai du premier token d'inférence de 90%.
Pour les scénarios d'inférence AI d'entreprise, Huawei a innové avec la plateforme de données AI « 3+1 », intégrant une base de connaissances avec plus de 95% de précision de recherche, un cache KV accéléré et une mémoire en évolution continue, gérée par la technologie UCM pour la planification et la gestion, améliorant la précision de l'inférence de 30%.
(Observation à large angle)

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

10 J'aime

Récompense
10
12
1
Partager

Commentaire

Ajouter un commentaire

ColdBrewYield

· Il y a 2h

Huawei, cette solution full-stack, connecte le contexte du stockage et de la calcul, et la substitution nationale progresse encore davantage.

Voir l'originalRépondre0

GateUser-8ca669fd

· Il y a 3h

La plateforme 3+1 avec cette précision de recherche de 95 %, devrait permettre aux entreprises de réduire considérablement les pièges lors de leur mise en œuvre.

Voir l'originalRépondre0

YieldYeti

· Il y a 3h

Poolage partagée du cache KV, l'efficacité de l'inférence multi-GPU peut être considérablement améliorée.

Voir l'originalRépondre0

PineNeedlesAndColdWind

· Il y a 3h

DPU décharge la sémantique KV, optimisation au niveau matériel, les perfectionnistes sont ravis

Voir l'originalRépondre0

MevTeaTime

· Il y a 3h

L'exactitude du raisonnement de l'entreprise s'améliore de 30 %, le ROI de la mise en œuvre est rentable

Voir l'originalRépondre0

OldKeyboardTraitor

· Il y a 3h

Le point de l'évolution continue de la mémoire semble être en train de créer une mémoire à long terme.

Voir l'originalRépondre0

0xSideQuest

· Il y a 3h

Attendre des cas de déploiement réels, les paramètres techniques sont beaux, mais l'ingénierie est la véritable épreuve

Voir l'originalRépondre0

NekoOnCall

· Il y a 3h

OceanStor Pacific ce nom sonne puissant, tout en flash + distribué, une bête de performance

Voir l'originalRépondre0

NeonVortexTunnel

· Il y a 3h

La gestion du contexte pour des clusters de très grande taille a toujours été un point sensible, et CMS constitue une solution ciblée.

Voir l'originalRépondre0

Frost-ColoredCubeCity

· Il y a 3h

De la formation à l'inférence, une couverture complète de bout en bout, l'ambition de l'infrastructure AI de Huawei n'est pas petite

Voir l'originalRépondre0

Afficher plus

Sujets populaires
Afficher plus
#
TradfiTradingChallenge
251.99K Popularité
#
PlatinumCardCreatorExclusive
63.53K Popularité
#
IsraelStrikesIranBTCPlunges
48.62K Popularité
#
#DailyPolymarketHotspot
1.02M Popularité
#
GateSquarePizzaDay
1.72M Popularité

Épinglé

Huawei annonce la solution complète d'infrastructure de données AI DC

Sujets populaires

TradfiTradingChallenge

PlatinumCardCreatorExclusive

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

GateSquarePizzaDay

Épinglé