Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
CFD
Derivados de CFD de acciones estadounidenses
Acciones EE. UU.
Accede a acciones y ETF estadounidenses reales
Acciones HK
Opera con acciones de calidad cotizadas en Hong Kong
Acciones surcoreanas
SK Hynix
Opera con acciones surcoreanas reales e invierte en activos populares
Futuros de acciones
Alto apalancamiento, trading 24/7
Acciones tokenizadas
Respaldado por acciones reales
IPO Access
Accede al acceso completo a las OPV de acciones globales
GUSD
Acuña GUSD para obtener rendimientos de RWA del Tesoro
Actividades de acciones
Opera con acciones populares y desbloquea grandes airdrops
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
IPO Access
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gate Wealth
Toma el control del futuro financiero
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
USD1 9 % TAE
Stake en 1 clic, ganancias diarias
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
Servicios VIP
Grandes descuentos en tarifas
Gestión de activos
Solución integral para la gestión de activos
Institucional
Soluciones de activos digitales: empresas
Desarrolladores (API)
Conecta con el ecosistema de aplicaciones Gate
Transferencia bancaria OTC
Deposita y retira fiat
Programa de bróker
Reembolsos generosos mediante API
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
OpenAI publica una evaluación de la monitorización de cadenas de pensamiento de código abierto: cuanto más larga es la CoT, más transparente; RL no enseña a los modelos a "ocultar pensamientos".
Las evaluaciones se dividen en tres prototipos: Intervention (tipo intervención, si el modelo de monitoreo puede detectar cambios en el comportamiento después de modificar la entrada del modelo), Process (tipo proceso, verificar si los pasos de razonamiento del modelo son reales) y Outcome-property (tipo propiedad de resultado, predecir desde la trayectoria de razonamiento si la salida presenta engaño de recompensa o violaciones de seguridad).
Hallazgos centrales del artículo: monitorear el CoT es más efectivo que monitorear solo las acciones y salidas finales del modelo; cuanto más largo sea el CoT, mayor será la monitoreabilidad; el entrenamiento con RL no reduce sustancialmente la monitoreabilidad incluso en la escala fronteriza actual. Un hallazgo práctico es que para modelos grandes con baja potencia de razonamiento, se puede cambiar a un modelo más pequeño pero con mayor potencia de razonamiento, logrando una mayor monitoreabilidad mientras se iguala la capacidad, a costa de un mayor costo computacional de razonamiento. Además, aumentar la potencia de razonamiento de un modelo de monitoreo débil puede mejorar su efectividad para monitorear modelos fuertes, y permitir que el modelo de monitoreo débil vea el CoT no solo mejora la monitoreabilidad, sino que también acelera esta tendencia de escalado.
La system card de GPT-5.4 Thinking ya ha utilizado este conjunto de evaluaciones. Los resultados muestran que la monitoreabilidad general del CoT de GPT-5.4 Thinking es ligeramente inferior a la de GPT-5 Thinking, pero no es una disminución general: en el escenario de agentic misalignment (desalineación del agente) se acerca al 100%, y las disminuciones se concentran principalmente en escenarios específicos como falta de evidencia en consultas de salud, sesgos de memoria y tareas imposibles. Después de la investigación, OpenAI considera que parte de la regresión se debe a las limitaciones de las propias evaluaciones. El repositorio ha descontinuado simultáneamente dos evaluaciones, Anti-Scheming y Memory, porque la primera tiene un desajuste entre el monitoreo general del CoT y el juicio de respuesta específica de la tarea, y la segunda tiene una precisión insuficiente en el juicio de respuestas.
(Fuente: BlockBeats)