Huawei lança solução de infraestrutura de dados de IA de pilha completa do Data Center

robot
Geração do resumo em andamento
Notícias do Mars Finance 22 de maio: a Huawei lançou oficialmente a solução de infraestrutura de dados de IA de pilha completa AI DC, o armazenamento distribuído de estado sólido OceanStor Pacific com 11PB/2U, líder na indústria em alta densidade de capacidade, alcançando o TCO mais eficiente para armazenamento de grandes volumes de dados. Voltado para cenários de grandes clusters de inferência, a Huawei lançou o primeiro armazenamento de memória de contexto que suporta computação heterogênea, o CMS (Context Memory Storage), que suporta acesso direto a KV semântica ou utiliza DPU dedicado para descarregamento semântico, podendo ser expandido para um pool de cache KV compartilhado de nível PB, reduzindo a latência do token inicial de inferência em 90%. Para cenários empresariais de inferência de IA, a Huawei criou o primeiro plataforma de dados de IA “3+1”, que integra um banco de dados de conhecimento com mais de 95% de precisão na recuperação, cache KV acelerado e um banco de memória em evolução contínua, gerenciado por tecnologia UCM para otimizar o agendamento e gerenciamento, aumentando a precisão da inferência em 30%. (Observação ampla)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 14
  • 1
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
QuietQuants
· 05-23 12:12
UCM gerenciamento de agendamento parece que criou um sistema operacional para dados de IA, é interessante
Ver originalResponder0
GateUser-21ddf7c7
· 05-22 19:39
Atraso do Token inicial caiu 90%? Então a experiência do usuário realmente mudou de forma substancial, aguardando testes práticos.
Ver originalResponder0
ColdBrewYield
· 05-22 07:25
A solução full-stack da Huawei desta vez, integração do contexto de armazenamento e computação, mais um avanço na substituição por produtos nacionais
Ver originalResponder0
GateUser-8ca669fd
· 05-22 06:49
A plataforma 3+1 com aquela precisão de busca de 95%, a implementação empresarial provavelmente ajudará a evitar muitos problemas.
Ver originalResponder0
YieldYeti
· 05-22 06:33
Cache KV de pool compartilhado, a eficiência de inferência em múltiplas GPUs pode melhorar bastante, né?
Ver originalResponder0
PineNeedlesAndColdWind
· 05-22 06:22
DPU descarrega a semântica KV, otimizações em nível de hardware, entusiastas de detalhes ficam extasiados
Ver originalResponder0
MevTeaTime
· 05-22 06:19
A precisão do raciocínio empresarial aumentou 30%, e o ROI da implementação compensa.
Ver originalResponder0
OldKeyboardTraitor
· 05-22 06:14
O ponto de evolução contínua do banco de memória parece estar criando uma memória de longo prazo.
Ver originalResponder0
0xSideQuest
· 05-22 06:12
Aguardando casos de implantação reais, os parâmetros técnicos são bonitos, mas a engenharia é a verdadeira batalha
Ver originalResponder0
NeonVortexTunnel
· 05-22 06:08
O gerenciamento de contexto de clusters de grande escala sempre foi um ponto problemático, o CMS é uma solução direcionada.
Ver originalResponder0
Ver projetos
  • Fixado