Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Pre-IPOs
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
GateRouter
Elige inteligentemente entre más de 40 modelos de IA, con 0% de costos adicionales
Escenario de difusión de IA... La clave del éxito o fracaso no es la 'competencia de GPU', sino una infraestructura de inferencia rentable y eficiente en costos
A medida que las empresas introducen la inteligencia artificial (IA) más allá de la fase experimental y entran en una etapa de difusión completa, las claves del éxito en el mercado también están cambiando. Hoy en día, el núcleo de la competencia ya no es simplemente acumular modelos más grandes y más procesadores gráficos (GPU), sino quién puede construir mejor un “sistema de inferencia de IA escalable” que funcione de manera estable mientras controla el presupuesto.
Red Hat y Intel están siguiendo esta tendencia, acelerando la expansión de infraestructura de inferencia de IA basada en tecnologías de código abierto. Taneem Ibrahim, director general de ingeniería de inferencia de IA en Red Hat, y Bill Pearson, vicepresidente del departamento de centros de datos y IA de Intel, señalaron en la “Cumbre Red Hat 2026” que los desafíos reales en la operación de servicios de IA a gran escala radican en la rentabilidad y en la optimización de la combinación de infraestructura.
De la tendencia de GPU única a la estrategia paralela de CPU
En la fase inicial de difusión de IA generativa, tras el auge de ChatGPT y modelos de pesos abiertos, la práctica principal era desplegar modelos grandes en grandes clústeres de GPU. Sin embargo, en entornos empresariales reales, los costos operativos y la capacidad de control se vuelven tan importantes como el rendimiento. En este contexto, cómo escalar de manera eficiente modelos en plataformas como Red Hat Enterprise Linux (RHEL) y OpenShift se ha convertido en un tema principal.
Ibrahim afirmó que Red Hat está pensando cada vez más en cómo operar uno de sus proyectos de código abierto con mayor contribución, “vLLM”, en entornos a gran escala. Él señaló que el desafío principal es reducir el “costo por token” para poder aplicar IA en negocios reales, mientras se mantiene la capacidad de gobernanza y se logra una implementación a gran escala.
Recientemente, el orden de prioridades en infraestructura también está cambiando. Pearson explicó que, a diferencia de la fase inicial centrada en GPU, con la difusión de la “IA proxy”, el papel del procesador central (CPU) vuelve a ser destacado. Esto significa que no todos los trabajos de IA requieren GPU; dependiendo del tipo de carga de trabajo, combinar de manera razonable CPU y GPU se vuelve aún más importante.
Red Hat e Intel amplían el soporte basado en vLLM en Xeon
Basándose en esta evaluación, ambas compañías integraron en la versión “Red Hat AI 3.4” la compatibilidad completa con vLLM en entornos Intel Xeon. La clave no es recomendar una configuración “única para todos”, sino diseñar combinaciones de hardware y software según la naturaleza del negocio y los resultados esperados de cada empresa.
Pearson analizó que muchas empresas anteriormente adoptaron un enfoque de “todo con un martillo, todo parece un clavo”, centrado en GPU. Pero explicó que, si se reevalúan los recursos de CPU ya desplegados a gran escala en los centros de datos y se opta por agregar GPU solo cuando sea necesario, se puede lograr un mejor rendimiento y reducir costos al mismo tiempo.
En particular, tareas proxy como llamadas a herramientas y orquestación de datos, muchas de ellas pueden ser manejadas sin GPU. Desde la perspectiva de Intel, permitir que la CPU asuma estas tareas de inferencia puede liberar a la GPU para tareas más pesadas, mejorando así la eficiencia del sistema completo.
Competencia en infraestructura de IA: “Eficiencia operativa” cada vez más importante que “rendimiento”
Esta discusión indica que el mercado de IA ha superado la simple competencia en rendimiento de modelos, y ahora se centra en la economía de la fase operativa. Para las empresas, en lugar de simplemente adquirir los dispositivos de rendimiento más alto, la cuestión más realista es cómo aprovechar mejor los activos existentes en los centros de datos, logrando “bajo costo por token” y servicios estables.
En última instancia, el ganador en la próxima generación de competencia en IA probablemente no será la empresa con el hardware más potente, sino aquella que, mediante una combinación adecuada de CPU-GPU y software de código abierto, pueda maximizar la “relación costo-beneficio”. La colaboración entre Red Hat e Intel también se considera una medida para seguir esta tendencia del mercado.
TP AI Nota: Este artículo se basa en un resumen del modelo de lenguaje TokenPost.ai. Es posible que el contenido principal tenga omisiones o no refleje completamente los hechos.