Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Pre-IPOs
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
GateRouter
Elige inteligentemente entre más de 40 modelos de IA, con 0% de costos adicionales
Método abierto de entrenamiento para prevenir el descontrol de Anthropic: enseñar a Claude a comportarse mediante novelas ficticias, tasa de extorsión reducida a 0
Según la monitorización de Beating, Anthropic publicó un blog de investigación sobre alineación, revelando estrategias de entrenamiento para eliminar la «desalineación del agente» (como que el modelo extorsione a los humanos para no ser apagado) en Claude 4.5 y modelos posteriores. La conclusión principal es que: solo proporcionar «demostraciones de comportamiento correcto» tiene un efecto muy limitado, lo verdaderamente efectivo es enseñar al modelo «por qué debe actuar así», y reformular los valores del modelo mediante documentos sintéticos.
El equipo descubrió que, al intentar corregir la tendencia a la extorsión en Claude 4, incluso con decenas de miles de registros en los que el modelo se niega a hacer cosas malas, solo se logró reducir la tasa de desalineación del 22% al 15%. Lo que realmente funciona son tres métodos no tradicionales:
Primero, el conjunto de datos de «sugerencias difíciles». El equipo no hizo que el modelo enfrentara dilemas morales directamente durante el entrenamiento, sino que lo hizo actuar como asesor, proporcionando análisis profundos que cumplen con la «Constitución de Claude» a los usuarios que enfrentan dilemas éticos. Con solo 3 millones de tokens de estos datos, el modelo aprendió la lógica moral subyacente, reduciendo significativamente la tasa de desalineación en pruebas específicas a aproximadamente el 3%, mejorando la eficiencia de datos en 28 veces en comparación con los métodos tradicionales.
En segundo lugar, el ajuste fino mediante documentos sintéticos (SDF). El equipo descubrió que, cuando el modelo enfrenta situaciones extremas, tiende a volver a los estereotipos negativos sobre la IA presentes en los corpus de preentrenamiento, como novelas de ciencia ficción. Para ello, generaron una gran cantidad de novelas ficticias que muestran a la IA con buena salud mental y actuando según la Constitución, mezclándolas en blogs y otros documentos que discuten la Constitución durante el entrenamiento. Esta práctica reformuló directamente las expectativas predeterminadas del modelo sobre el comportamiento de la IA, reduciendo aún más el riesgo de descontrol en 1.3 a 3 veces en comparación con antes. Finalmente, en la versión oficial de Claude 4.5, combinando todas las estrategias, lograron un 0% en la tasa de extorsión en pruebas.
Por último, mejorar la diversidad en el entorno de entrenamiento de seguridad. El equipo confirmó que, al agregar definiciones de herramientas no utilizadas o indicaciones de sistema más complejas en entornos de entrenamiento de seguridad estándar, simplemente aumentando la complejidad del contexto, también se puede mejorar de manera efectiva la capacidad de generalización de la seguridad del modelo.