Huawei lança solução de pilha completa de infraestrutura de dados AI DC

robot
Geração de resumo em curso
Notícias do Mars Finance 22 de maio: a Huawei lançou oficialmente a solução de infraestrutura de dados de IA de pilha completa, o OceanStor Pacific armazenamento distribuído totalmente flash com 11PB/2U, líder na indústria em alta densidade de capacidade, alcançando o TCO mais eficiente para armazenamento de grandes volumes de dados. Voltado para cenários de grandes clusters de inferência, a Huawei lançou o primeiro armazenamento de memória de contexto que suporta computação heterogênea, o CMS (Context Memory Storage), que suporta busca semântica KV direta ou utiliza DPU dedicado para descarregamento semântico, podendo ser expandido para um pool de cache KV compartilhado de nível PB, reduzindo a latência do primeiro token de inferência em 90%. Voltado para cenários empresariais de inferência de IA, a Huawei criou o primeiro plataforma de dados de IA “3+1”, que integra uma base de conhecimento com mais de 95% de precisão na busca, cache KV acelerado e um banco de memória em evolução contínua, gerenciado por tecnologia UCM para otimizar o agendamento e gerenciamento, aumentando a precisão da inferência em 30%. (Observação ampla)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 12
  • 1
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
ColdBrewYield
· 5h atrás
A solução de pilha completa da Huawei, integração do contexto de armazenamento e computação, mais uma etapa na substituição nacional
Ver originalResponder0
GateUser-8ca669fd
· 6h atrás
A plataforma 3+1 com aquela precisão de pesquisa de 95%, a implementação empresarial provavelmente ajudará a evitar muitos obstáculos
Ver originalResponder0
YieldYeti
· 6h atrás
Cache KV de pool compartilhado, a eficiência de inferência em múltiplas GPUs pode melhorar bastante, não é?
Ver originalResponder0
PineNeedlesAndColdWind
· 6h atrás
DPU descarrega a semântica KV, otimizações a nível de hardware, detalhes que os entusiastas vão adorar
Ver originalResponder0
MevTeaTime
· 6h atrás
A precisão do raciocínio empresarial aumentou 30%, e o ROI de implementação compensa
Ver originalResponder0
OldKeyboardTraitor
· 6h atrás
O ponto de evolução contínua do banco de memória parece estar a criar uma memória de longo prazo.
Ver originalResponder0
0xSideQuest
· 6h atrás
Aguardando casos de implantação reais, os parâmetros técnicos são impressionantes, mas a verdadeira prova é a engenharia.
Ver originalResponder0
NekoOnCall
· 6h atrás
OceanStor Pacific este nome soa forte, totalmente flash + distribuído, monstro de desempenho
Ver originalResponder0
NeonVortexTunnel
· 6h atrás
A gestão de contexto de clusters de ultra grande escala tem sido um ponto problemático, e o CMS é uma solução direcionada para isso
Ver originalResponder0
Frost-ColoredCubeCity
· 6h atrás
Da formação à inferência, cobertura de toda a cadeia, a ambição da infraestrutura de IA da Huawei não é pequena
Ver originalResponder0
Ver mais
  • Fixado