Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Pre-IPOs
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
Servicios VIP
Grandes descuentos en tarifas
Gestión de activos
Solución integral para la gestión de activos
Institucional
Soluciones de activos digitales: empresas
Desarrolladores (API)
Conecta con el ecosistema de aplicaciones Gate
Transferencia bancaria OTC
Deposita y retira fiat
Programa de bróker
Reembolsos generosos mediante API
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
GateRouter
Elige inteligentemente entre más de 40 modelos de IA, con 0% de costos adicionales
DeepSeek nueva publicación: Cómo la arquitectura de hiperconexión con restricción de variedad resuelve los problemas de entrenamiento de redes profundas
【链文】DeepSeek最近发布 de la nueva investigación ha despertado interés en el círculo tecnológico. Propusieron una nueva arquitectura llamada restricción de variedad de hiperconexión (mHC), cuyo objetivo principal es muy directo: resolver dos puntos débiles de las redes de hiperconexión existentes (HC): inestabilidad en el entrenamiento y limitaciones en la escalabilidad.
La raíz del problema radica en que la tecnología HC rompe las propiedades de la identidad. La solución de DeepSeek es mapear el espacio de conexiones residuales de HC a una variedad específica, de modo que se pueda restaurar la propiedad de la identidad. Suena un poco abstracto, pero en pocas palabras, se trata de usar mapeos matemáticos más inteligentes para hacer que el entrenamiento de redes profundas sea más estable y escalable.
El artículo también combina optimización de infraestructura para garantizar eficiencia práctica, y los resultados experimentales muestran mejoras de rendimiento evidentes, además de una excelente escalabilidad. Esto significa que al usar estructuras de red más profundas, el proceso de entrenamiento se vuelve más controlable.
DeepSeek considera que mHC es una extensión flexible y práctica de la tecnología HC, que no solo ayuda a la industria a comprender más profundamente el diseño de arquitecturas topológicas, sino que también señala una dirección prometedora para la evolución de grandes modelos. Este trabajo fue realizado en colaboración por 解振达, 韦毅轩, 曹焕琪 y 梁文锋, entre otros.
A largo plazo, estos avances en infraestructura básica tendrán un impacto profundo en la estabilidad y escalabilidad de los grandes modelos.
¿Sigues haciendo esas magias matemáticas oscuras? En realidad, solo es para que el entrenamiento de la red no falle
No entiendo la restricción de variedades, pero si los datos experimentales se ven bien, eso basta
¿La red profunda finalmente puede entrenarse de manera estable? Ahora otra vez muchos serán superados
Pero hablando en serio, si realmente se puede resolver la escalabilidad, la implementación práctica será mucho más rápida
Si esta tesis es realmente confiable, significa que aún hay muchos obstáculos por superar en la capa base de la IA
Espera, ¿cómo de eficiente será esto en la práctica? No me digas que solo en papel se ve bien
La nueva arquitectura suena genial, pero hay que esperar a que el mercado verifique su efectividad, de todos modos, yo solo me río y respeto.
Esta lógica es como invertir en criptomonedas, la teoría es perfecta, pero en la práctica se desploma, jaja.
DeepSeek en esta ola está allanando el camino para el entrenamiento de modelos grandes, si la red profunda se estabiliza, la probabilidad de que aparezcan modelos de nivel monstruo será un poco mayor.
Honestamente, si se hace bien este tipo de investigación básica, los beneficios serán para esas grandes empresas, nosotros, los inversores minoristas, solo podemos comer las sobras.
Si realmente puede estabilizar el entrenamiento profundo, entonces hay que revisar bien los datos experimentales, no sea que otra vez el papel luzca bien pero en la práctica falle.
La recuperación de la propiedad de la identidad... esperemos a recibir retroalimentación del entorno de producción antes de alabarlo demasiado.
Los artículos de Deep cada vez son más competitivos, si realmente hay un avance en escalabilidad, sería una buena noticia para los costos de entrenamiento de grandes modelos.
La teoría de mapeo matemático la tengo que revisar con cuidado, parece que otra vez tendremos que relacionar la teoría con la práctica durante un buen rato.
Los datos en cadena aún no muestran movimiento, nosotros los minoristas seguimos observando primero, para no convertirnos en los que compran en el pico. Pero hablando en serio, esta ola de DeepSeek realmente está en el centro de la tormenta, los que apostaron temprano pueden estar riéndose.
La restricción de la variedad suena muy avanzada, pero ¿qué tan lejos está esta innovación arquitectónica de una aplicación práctica real? ¿Hay grandes instituciones ya haciendo arbitraje en este campo?
Para ser honestos, los avances tecnológicos puros a menudo son demasiado sobrevalorados, en realidad apuesto a la reacción del mercado, no al documento en sí. Cuando las tarifas de minería suban, será momento de salir corriendo.
¿Cuándo saldrán los últimos datos de escalabilidad? ¿Hay una comparación detallada con soluciones similares? Eso es lo que realmente me importa.
---
DeepSeek ha sacado una nueva función, parece que están reparando los viejos problemas de la tecnología HC.
---
Todo lo que han dicho es para hacer que el entrenamiento sea más estable, pero cuánto puede acelerar realmente todavía está por verse.
---
No entendí mucho esa parte de la identidad, parece que los que escriben artículos simplemente complican las cosas simples.
---
¿Ventajas de escalabilidad superiores? ¿Cuántos puntos porcentuales más rápidos que las soluciones existentes? ¿Hay benchmarks?
---
Otra arquitectura "revolucionaria", a ver si en escenarios reales se puede usar o no.
---
La palabra restricción de variedades suena muy cara, no sé cómo será el coste en ejecución.
---
La optimización de algoritmos siempre es: "en teoría funciona muy bien, en la práctica depende de la GPU".
---
Parece que han puesto esfuerzo, pero siento que en el artículo todo son solo adornos, ¿dónde están los detalles?
---
Se resolvió el problema de estabilidad en el entrenamiento de redes profundas, ¿pero qué pasa con el uso de memoria? Este tipo de soluciones suele tener problemas de estabilidad.
¿Restricción de variedad? En palabras sencillas, es para evitar que el entrenamiento de la red colapse, de todos modos no lo entendí jaja.
La red profunda ahora es más estable, ¿esto ayuda en la optimización de la minería?
¿La mapeo matemático, mapeo, mapeo, puede mejorar directamente la eficiencia del cálculo de la tarifa de gas, ¿verdad?
DeepSeek vuelve a estar en la construcción del modelo, este ritmo realmente no puedo seguirlo.
Solo quiero saber si al final podrá funcionar sin colapsar, todo lo demás es superficial.