Compra criptomonedas

Pagar con

USD

Acepta Visa, Mastercard, SEPA y más

Trading flexible y sin tarifas

Paga con tus cripto en todo el mundo

Básico

Opera con criptomonedas libremente

Multiplica tus beneficios con el apalancamiento

Convertir e Inversión automática

Opera cualquier volumen sin tarifas ni deslizamiento

Obtén exposición a posiciones apalancadas de forma sencilla

Trading premercado

Opera nuevos tokens antes de su listado

Avanzado

Opera on-chain con Gate Wallet

Acceso inteligente a novedades on-chain

Estrategias smart y trading automatizado

Sigue estrategias de trading de expertos

Trading CrossEx

Un solo saldo de margen compartido entre plataformas

Accede a cientos de contratos perpetuos

Plataforma global de activos tradicionales

Opera con opciones estándar al estilo europeo

Cuenta unificada

Maximiza la eficacia de tu capital

Trading de prueba

Introducción al trading de futuros

Prepárate para operar con futuros

Eventos de futuros

Únete a eventos para ganar recompensas

Trading de prueba

Usa fondos virtuales para probar el trading sin asumir riesgos

Derivados de CFD de acciones estadounidenses

Acciones EE. UU.

Accede a acciones y ETF estadounidenses reales

Opera con acciones de calidad cotizadas en Hong Kong

Acciones surcoreanas

Opera con acciones surcoreanas reales e invierte en activos populares

Futuros de acciones

Alto apalancamiento, trading 24/7

Acciones tokenizadas

Respaldado por acciones reales

Accede al acceso completo a las OPV de acciones globales

Acuña GUSD para obtener rendimientos de RWA del Tesoro

Actividades de acciones

Opera con acciones populares y desbloquea grandes airdrops

Lanzamiento

Acumula golosinas para ganar airdrops

Staking rápido, ¡gana nuevos tokens con potencial!

Holdea GT y consigue airdrops enormes gratis

Accede al acceso completo a las OPV de acciones globales

Opera activos on-chain y recibe airdrops

Puntos de futuros

Gana puntos de futuros y reclama recompensas de airdrop

Inversión

Genera intereses con los tokens inactivos

Inversión automática

Invierte automáticamente de forma regular

Inversión dual

Aprovecha la volatilidad del mercado

Staking flexible

Gana recompensas con el staking flexible

Préstamo de criptomonedas

Usa tu cripto como garantía y pide otra en préstamo

Centro de préstamos

Centro de préstamos integral

Centro de patrimonio VIP

Planes de aumento patrimonial prémium

Toma el control del futuro financiero

Estrategias cuantitativas de alto nivel

Haz staking de criptomonedas para ganar en productos PoS

Apalancamiento inteligente

Apalancamiento sin liquidación

Sin bloqueo, opera y retira.

Descubra el valor en criptomonedas

Análisis del mercado de criptomonedas en tiempo real

Chatea con traders de criptomonedas

Lo que está ocurriendo en el mundo de las criptomonedas

Más

Promociones

Centro de actividades

Únete a actividades y gana recompensas

Invita amigos y gana por tus referidos

Programa de afiliados

Gana recompensas de comisión exclusivas

Aumenta tu influencia y gana airdrops

Novedades de plataforma en tiempo real

Artículos del sector de las criptomonedas

Grandes descuentos en tarifas

Gestión de activos

Solución integral para la gestión de activos

Soluciones de activos digitales: empresas

Desarrolladores (API)

Conecta con el ecosistema de aplicaciones Gate

Transferencia bancaria OTC

Deposita y retira fiat

Programa de bróker

Reembolsos generosos mediante API

AI

Tu compañero de IA conversacional para todo

Usa Gate AI directamente en tu aplicación social

Gate Blue Lobster, listo para usar

Gate for AI Agent

Infraestructura de IA, Gate MCP, Skills y CLI

Gate Skills Hub

+10 000 habilidades

De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA

Otros

Encuentra preguntas frecuentes y guías de ayuda

Aprende a invertir en criptomonedas

Crece con los campeones

Prueba de Reservas

Gate garantiza el 100 % de prueba de reservas

Mantén tus activos seguros

V4 actualización post-entrenamiento: OPD sustituye a RL híbrido, destilando una docena de modelos expertos en uno.

2026-07-02 06:56:03

Generación de resúmenes en curso

ME News noticia, 24 de abril (UTC+8), según el monitoreo de Dongcha Beating, la metodología de post-entrenamiento de DeepSeek V4 ha cambiado significativamente: la fase de mixed RL de V3.2 ha sido completamente reemplazada por On-Policy Distillation (OPD, destilación de políticas en línea).
El nuevo proceso consta de dos pasos. Primer paso: para áreas como matemáticas, código, Agent, seguimiento de instrucciones, se entrenan respectivamente modelos expertos en el dominio basados en el pipeline de V3.2. Cada experto primero se afina y luego se entrena con refuerzo mediante GRPO. Segundo paso: usando OPD multi-maestro, se destilan las capacidades de más de diez expertos en un modelo unificado: el estudiante, sobre sus propias trayectorias generadas, realiza destilación de logits de vocabulario completo con divergencia KL inversa para cada maestro, y mediante la alineación a nivel de logits se fusionan los pesos de múltiples expertos en un espacio de parámetros unificado, evitando los conflictos de capacidad comunes en la combinación de pesos tradicional y mixed RL.
El informe también propone Generative Reward Model (GRM, modelo de recompensa generativa): para tareas difíciles de verificar con reglas, ya no se entrena un modelo de recompensa escalar tradicional, sino que se entrena GRM con datos de RL guiados por rúbrica, permitiendo que la red actor asuma simultáneamente capacidades de generación y evaluación, y con una pequeña cantidad de anotaciones humanas diversas se puede generalizar a tareas complejas.
(Fuente: BlockBeats)

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
GateCompletesDividendDistribution
536,11K Popularidad
#
CirclePlunges17%
4,16M Popularidad
#
IsraelStrikesIranBTCPlunges
67,51K Popularidad
#
PredictWorldCupShare20000U
162,83K Popularidad
#
GateCardPointsSystemLaunched
120,28K Popularidad

Fijado