Futuros
Acesse centenas de contratos perpétuos
CFD
Ouro
Plataforma única para ativos tradicionais globais
Opções
Hot
Negocie opções vanilla no estilo europeu
Conta unificada
Maximize sua eficiência de capital
Negociação demo
Introdução à negociação de futuros
Prepare-se para sua negociação de futuros
Eventos de futuros
Participe de eventos e ganhe recompensas
Negociação demo
Use fundos virtuais para experimentar negociações sem riscos
Lançamento
CandyDrop
Colete candies para ganhar airdrops
Launchpool
Staking rápido, ganhe novos tokens em potencial
HODLer Airdrop
Possua GT em hold e ganhe airdrops massivos de graça
Pre-IPOs
Desbloqueie o acesso completo a IPO de ações globais
Pontos Alpha
Negocie on-chain e receba airdrops
Pontos de futuros
Ganhe pontos de futuros e colete recompensas em airdrop
Investimento
Simple Earn
Ganhe juros com tokens ociosos
Autoinvestimento
Invista automaticamente regularmente
Investimento duplo
Lucre com a volatilidade do mercado
Soft Staking
Ganhe recompensas com stakings flexíveis
Empréstimo de criptomoedas
0 Fees
Penhore uma criptomoeda para pegar outra emprestado
Centro de empréstimos
Centro de empréstimos integrado
Centro de riqueza VIP
Planos premium de crescimento de patrimônio
Gestão privada de patrimônio
Alocação premium de ativos
Fundo Quantitativo
Estratégias quant de alto nível
Apostar
Faça staking de criptomoedas para ganhar em produtos PoS
Alavancagem Inteligente
Alavancagem sem liquidação
Cunhagem de GUSD
Cunhe GUSD para retornos em RWA
Promoções
Centro de atividade
Participe de atividades e ganhe recompensas
Indicação
20 USDT
Convide amigos para recompensas de ind.
Programa de afiliados
Ganhe recomp. de comissão exclusivas
Gate Booster
Aumente a influência e ganhe airdrops
Anúncio
Atualizações na plataforma em tempo real
Blog da Gate
Artigos do setor de criptomoedas
Serviços VIP
Grandes Descontos nas Taxas
Gerenciamento de ativos
Solução completa de gerenciamento de ativos
Institucional
Soluções de ativos digitais para empresas
Desenvolvedores (API)
Conecta-se ao ecossistema de aplicativos da Gate
Transferência Bancária OTC
Deposite e retire moedas fiat
Programa de corretoras
Mecanismos de grandes descontos via API
AI
Gate AI
Seu parceiro de IA conversacional para todas as horas
Gate AI Bot
Use o Gate AI diretamente no seu aplicativo social
GateClaw
Gate Blue Lobster, pronto para usar
Gate for AI Agent
Infraestrutura de IA, Gate MCP, Skills e CLI
Gate Skills Hub
10K+ habilidades
Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA
GateRouter
Escolha inteligentemente entre mais de 40 modelos de IA, com 0% de taxas extras
Huawei e Universidade de Ciência e Tecnologia unem forças para romper o monopólio da Nvidia, o especialista em aceleração de cálculo de grandes modelos Ascend A3 aumenta a velocidade em 58%
No entanto, a maioria das estruturas de grandes modelos mainstream são baseadas no ecossistema CUDA da Nvidia, e a sua migração direta para a plataforma Ascend frequentemente enfrenta desafios como agendamento desigual de filas de hardware e baixa eficiência no uso do poder de processamento.
A Universidade de Ciência e Tecnologia da China, Huawei e Universidade de Pequim lançaram conjuntamente a estrutura de compilação e agendamento HyperParallel-MoE, que ajusta a nível de tile as filas de hardware exclusivas do Ascend A3, visando superar o gargalo de eficiência energética no agendamento paralelo de capacidades heterogêneas de computação.
O Ascend A3 possui duas categorias de núcleos: AIC, responsável por multiplicação de matrizes, e AIV, que trata de cálculos vetoriais e comunicação.
Porém, sob o agendamento serial tradicional de operadores, esses dois tipos de núcleos só podem trabalhar alternadamente, ficando ociosos em turnos.
Dados de testes mostram que, ao rodar um grande modelo estilo DeepSeek de 671 bilhões de parâmetros em um cluster de 256 nós, a utilização do AIC é de apenas 67%, e 39% do atraso na comunicação de roteamento especializado é exposto na rota crítica de cálculo.
As principais mudanças na HyperParallel-MoE incluem três itens.
Primeiro, o design de uma primitive de escrita unilateral conduzida pelo AIV, que dispara o cálculo assim que a tile de dados chega, sem precisar esperar que toda a batch esteja completa.
Segundo, a introdução de geração de tarefas de tile com percepção de dependências, unificando a abstração de comunicação e operadores de cálculo.
Terceiro, o pré-gerenciamento de sequências de tarefas por um agendador estático, que conduz os dois tipos de núcleos em paralelo dentro de um único kernel, aproveitando o cache L2 de alta velocidade para compartilhar resultados intermediários, reduzindo atrasos de escrita e leitura na memória lenta HBM.
Testes mostram que, sob roteamento balanceado de 64 nós, o módulo principal responsável pelo cálculo de especialistas (MoE-FFN) reduziu seu atraso em aproximadamente 36%, o que equivale a uma melhora de até 58% na velocidade de processamento de dados (de 1,49 a 1,58 vezes mais rápido).
Na operação end-to-end do sistema, a velocidade de treinamento por passo também aumentou entre 8% e 9%.
Isso indica que a eficiência energética real do Ascend depende não apenas das especificações de hardware, mas também de se o compilador e o runtime podem agendar de forma eficiente os núcleos AIC/AIV.