Futuros
Aceda a centenas de contratos perpétuos
TradFi
Ouro
Plataforma de ativos tradicionais globais
Opções
Hot
Negoceie Opções Vanilla ao estilo europeu
Conta Unificada
Maximize a eficiência do seu capital
Negociação de demonstração
Introdução à negociação de futuros
Prepare-se para a sua negociação de futuros
Eventos de futuros
Participe em eventos para recompensas
Negociação de demonstração
Utilize fundos virtuais para experimentar uma negociação sem riscos
Lançamento
CandyDrop
Recolher doces para ganhar airdrops
Launchpool
Faça staking rapidamente, ganhe potenciais novos tokens
HODLer Airdrop
Detenha GT e obtenha airdrops maciços de graça
Launchpad
Chegue cedo ao próximo grande projeto de tokens
Pontos Alpha
Negoceie ativos on-chain para airdrops
Pontos de futuros
Ganhe pontos de futuros e receba recompensas de airdrop
Investimento
Simple Earn
Ganhe juros com tokens inativos
Investimento automático
Invista automaticamente de forma regular.
Investimento Duplo
Aproveite a volatilidade do mercado
Soft Staking
Ganhe recompensas com staking flexível
Empréstimo de criptomoedas
0 Fees
Dê em garantia uma criptomoeda para pedir outra emprestada
Centro de empréstimos
Centro de empréstimos integrado
A Google lançou o Guia de Treinamento para Desenvolvedores do sétimo geração do TPU Ironwood, detalhando otimizações de desempenho a nível de sistema
Notícias ME, mensagem de 2 de abril (UTC+8): recentemente, a Google publicou oficialmente um guia de formação para programadores destinado à sétima geração do Ironwood TPU. O guia pretende ajudar os programadores a tirar pleno partido do desempenho ao nível de sistema do Ironwood TPU, para treinar e implementar eficientemente modelos de IA de ponta. O Ironwood TPU é uma infraestrutura de IA personalizada, concebida para satisfazer as necessidades de computação de modelos com biliões de parâmetros; através de tecnologias como interligações entre chips (ICI), switches de troca de caminhos ópticos (OCS), rede de centros de dados (DCN) e memória de banda alta agregada (HBM), constrói um sistema completo que suporta até 9.216 chips. O texto descreve detalhadamente várias estratégias de optimização fundamentais para este hardware, incluindo: tirar partido do suporte nativo das suas unidades de multiplicação de matrizes (MXU) para treinos FP8 para aumentar o débito; utilizar a biblioteca de kernels Tokamax, optimizada para TPU, desenvolvida para JAX, através de “atenção salpicada” e “multiplicação de matrizes agrupadas Megablox” para processar tensores irregulares em longos contextos e em modelos de especialistas mistos; recorrer ao quarto núcleo esparso (SparseCore) para descarregar operações de comunicação colectivas e ocultar a latência; ajustar com precisão a alocação da SRAM rápida em chip do TPU (VMEM) para reduzir a paragem da memória; e, consoante a dimensão do modelo, a arquitectura e o comprimento da sequência, seleccionar a melhor estratégia de particionamento (como FSDP, TP, EP). (Fonte: InFoQ)