Pagar com

USD

Visa, Mastercard, SEPA e mais

Negociação flexível e sem taxas

Cartão da Gate

Pague com criptomoedas no mundo todo

Básico

Negocie criptomoedas livremente

Amplie seu lucro com alavancagem

Convert & Auto-Invest

Trade any size with no fees and no slippage

Exposição para posições alavancadas de forma simples

Negociação pré-mercado

Negocie novos tokens pré-listagem

Avançado

Negocie on-chain com a Gate Wallet

Acesso inteligente a novos tokens on-chain

Estratégias smart e negociação automática

Siga estratégias de especialistas

Negociação CrossEx

Um único saldo de margem, compartilhado entre as plataformas

Acesse centenas de contratos perpétuos

Plataforma única para ativos tradicionais globais

Negocie opções vanilla no estilo europeu

Conta unificada

Maximize sua eficiência de capital

Negociação demo

Introdução à negociação de futuros

Prepare-se para sua negociação de futuros

Eventos de futuros

Participe de eventos e ganhe recompensas

Negociação demo

Use fundos virtuais para experimentar negociações sem riscos

Derivativos de CFD de ações dos EUA

Ações dos EUA

Acesse ações e ETFs reais dos EUA

Ações de Hong Kong

Negocie ações de qualidade listadas em Hong Kong

Ações da Coreia

Negocie ações da Coreia reais e invista em ativos populares

Futuros de ações

Alta alavancagem, negociação 24/7

Ações tokenizadas

Respaldado por ativos de ações reais

Desbloqueie o acesso completo a IPO de ações globais

Cunhe GUSD para rendimentos de RWA do Tesouro

Atividades de ações

Negocie ações populares e desbloqueie airdrops generosos

Lançamento

Colete candies para ganhar airdrops

Staking rápido, ganhe novos tokens em potencial

Possua GT em hold e ganhe airdrops massivos de graça

Desbloqueie o acesso completo a IPO de ações globais

Negocie on-chain e receba airdrops

Pontos de futuros

Ganhe pontos de futuros e colete recompensas em airdrop

Investimento

Ganhe juros com tokens ociosos

Autoinvestimento

Invista automaticamente regularmente

Investimento duplo

Lucre com a volatilidade do mercado

Ganhe recompensas com stakings flexíveis

Empréstimo de criptomoedas

Penhore uma criptomoeda para pegar outra emprestado

Centro de empréstimos

Centro de empréstimos integrado

Centro de riqueza VIP

Planos premium de crescimento de patrimônio

Assuma o controle do seu futuro financeiro

Fundo Quantitativo

Estratégias quant de alto nível

Faça staking de criptomoedas para ganhar em produtos PoS

Alavancagem Inteligente

Alavancagem sem liquidação

Sem bloqueio, negocie e saque

Descubra o valor em criptografia

Análise de mercado de criptomoedas ao vivo

Converse com os traders de criptomoedas

Novidades sobre criptomoedas

Mais

Promoções

Centro de atividade

Participe de atividades e ganhe recompensas

Convide amigos para recompensas de ind.

Programa de afiliados

Ganhe recomp. de comissão exclusivas

Aumente a influência e ganhe airdrops

Atualizações na plataforma em tempo real

Artigos do setor de criptomoedas

Grandes Descontos nas Taxas

Gerenciamento de ativos

Solução completa de gerenciamento de ativos

Soluções de ativos digitais para empresas

Desenvolvedores (API)

Conecta-se ao ecossistema de aplicativos da Gate

Transferência Bancária OTC

Deposite e retire moedas fiat

Programa de corretoras

Mecanismos de grandes descontos via API

AI

Seu parceiro de IA conversacional para todas as horas

Use o Gate AI diretamente no seu aplicativo social

Gate Blue Lobster, pronto para usar

Gate for AI Agent

Infraestrutura de IA, Gate MCP, Skills e CLI

Gate Skills Hub

10K+ habilidades

Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA

Outros

Central de Ajuda

Encontre perguntas frequentes e guias de ajuda

Saiba mais sobre o investimento em criptomoedas

Cresça com os campeões

Comprovante de Reservas

Gate promete 100% de comprovação de reservas

Mantenha seus ativos seguros

V4 pós-treinamento atualizado: OPD substitui RL híbrido, destilação de uma dúzia de modelos especialistas em um.

2026-07-02 06:56:03

Geração do resumo em andamento

ME News informa, em 24 de abril (UTC+8), de acordo com o monitoramento da Dongcha Beating, a metodologia de pós-treinamento do DeepSeek V4 sofreu uma grande mudança: a fase mixed RL do V3.2 foi completamente substituída pelo On-Policy Distillation (OPD, destilação de política online).
O novo processo é dividido em duas etapas. Primeira etapa: para áreas como matemática, código, Agent, seguimento de instruções, treinar modelos especialistas separadamente com base no pipeline V3.2, cada especialista primeiro faz fine-tuning e depois usa GRPO para aprendizado por reforço.
Segunda etapa: usar OPD com múltiplos professores para destilar as capacidades de mais de dez especialistas em um modelo unificado: o aluno, em suas próprias trajetórias geradas, realiza destilação de logits de vocabulário completo com divergência KL reversa para cada professor, combinando os pesos dos múltiplos especialistas em um espaço de parâmetros unificado por meio do alinhamento no nível de logits, evitando conflitos de capacidade comuns no weight merging tradicional e no mixed RL.
O relatório também propõe o Generative Reward Model (GRM, modelo de recompensa generativo): para tarefas difíceis de verificar com regras, não se treina mais o modelo de recompensa escalar tradicional, mas sim se treina o GRM com dados de RL guiados por rubrica, permitindo que a rede ator assuma simultaneamente capacidades de geração e julgamento, generalizando para tarefas complexas com apenas algumas anotações humanas diversificadas.
(Fonte: BlockBeats)

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

Adicionar um comentário

Adicionar um comentário

Sem comentários

Tendências
Ver projetos
#
GateCompletesDividendDistribution
532,53K Popularidade
#
CirclePlunges17%
4,16M Popularidade
#
IsraelStrikesIranBTCPlunges
67,51K Popularidade
#
PredictWorldCupShare20000U
160,83K Popularidade
#
GateCardPointsSystemLaunched
119,6K Popularidade

Fixado