Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
CFD
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
CFD
Derivados de CFD de acciones estadounidenses
Acciones EE. UU.
Accede a acciones y ETF estadounidenses reales
Acciones HK
Opera con acciones de calidad cotizadas en Hong Kong
Futuros de acciones
Alto apalancamiento, trading 24/7
Acciones tokenizadas
Respaldado por acciones reales
IPO Access
Accede al acceso completo a las OPV de acciones globales
GUSD
Acuña GUSD para obtener rendimientos de RWA del Tesoro
Actividades de acciones
Opera con acciones populares y desbloquea grandes airdrops
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
IPO Access
Accede al acceso completo a las OPV de acciones globales
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
USD1 15% TAE
Sin bloqueo, opera y retira
Promociones
Centro de actividades
Únete a actividades y gana recompensas
Referido
20 USDT
Invita amigos y gana por tus referidos
Programa de afiliados
Gana recompensas de comisión exclusivas
Gate Booster
Aumenta tu influencia y gana airdrops
Anuncio
Novedades de plataforma en tiempo real
Gate Blog
Artículos del sector de las criptomonedas
Servicios VIP
Grandes descuentos en tarifas
Gestión de activos
Solución integral para la gestión de activos
Institucional
Soluciones de activos digitales: empresas
Desarrolladores (API)
Conecta con el ecosistema de aplicaciones Gate
Transferencia bancaria OTC
Deposita y retira fiat
Programa de bróker
Reembolsos generosos mediante API
AI
Gate AI
Tu compañero de IA conversacional para todo
Gate AI Bot
Usa Gate AI directamente en tu aplicación social
GateClaw
Gate Blue Lobster, listo para usar
Gate for AI Agent
Infraestructura de IA, Gate MCP, Skills y CLI
Gate Skills Hub
+10 000 habilidades
De la oficina al trading, una biblioteca de habilidades todo en uno para sacar el máximo partido a la IA
o3:Especificaciones completas, precios, integración API y escenarios de aplicación (2026)
¿Qué es o3?
o3 es un modelo de razonamiento lanzado por OpenAI, publicado el 16 de abril de 2025, con una ventana de contexto de 200,000 tokens, capaz de realizar razonamiento avanzado en textos, código e imágenes. Hasta junio de 2026, la tarifa de la API es de $2.00 por millón de tokens de entrada y $8.00 por millón de tokens de salida. La página de modelos de OpenAI describe o3 como adecuado para escenarios que involucran matemáticas, ciencias, programación, razonamiento visual, escritura técnica y problemas de múltiples pasos que requieren seguir instrucciones.
La serie de modelos o de OpenAI está diseñada para tareas donde la calidad del razonamiento es prioritaria sobre la velocidad de respuesta. Los usuarios suelen comparar o3 con modelos multimodales generales como GPT-4o, alternativas de bajo costo como GPT-4o mini, y modelos multimodales rápidos como Gemini 2.0 Flash.
¿Cuáles son las especificaciones clave y precios de o3?
La siguiente tabla distingue las especificaciones del proveedor de OpenAI y los detalles de acceso de Gate.AI. OpenAI es la fuente oficial de las especificaciones del modelo y la estructura de precios por tokens; la documentación de Gate.AI verifica la compatibilidad con la API base y el endpoint de chat-completions de OpenAI.
| Campo | Valor | | -------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | Proveedor | OpenAI (hasta junio de 2026) | | Serie de modelos | Serie de modelos de razonamiento o de OpenAI (hasta junio de 2026) | | Tipo de modelo | Modelo de razonamiento para tareas complejas (hasta junio de 2026) | | Fecha de lanzamiento | 16 de abril de 2025 (hasta junio de 2026) | | Ventana de contexto | 200,000 tokens (hasta junio de 2026) | | Máximo de tokens de salida | 100,000 tokens (hasta junio de 2026) | | Precio de entrada | La tarifa de API de OpenAI es de $2.00 por millón de tokens de entrada (hasta junio de 2026) | | Precio de entrada en caché | La tarifa de API de OpenAI es de $0.50 por millón de tokens de entrada en caché (hasta junio de 2026) | | Precio de salida | La tarifa de API de OpenAI es de $8.00 por millón de tokens de salida (hasta junio de 2026) | | Unidad de precios | Por millón de tokens de texto (hasta junio de 2026) | | Soporte de modalidades | Soporta entrada/salida de texto, entrada de imagen; no soporta audio ni video (hasta junio de 2026) | | Tipos de entrada soportados | Texto, imágenes (hasta junio de 2026) | | Tipos de salida soportados | Texto (hasta junio de 2026) | | Acceso a API | API de OpenAI; API compatible con OpenAI de Gate.AI, usando openai/o3 como ID de modelo de Gate.AI (hasta junio de 2026) | | ID del modelo | OpenAI: o3; Instantánea de OpenAI: o3-2025-04-16; Gate.AI: openai/o3 (hasta junio de 2026) | | Disponibilidad | API de OpenAI; API de Gate.AI accesible mediante chat completions compatibles con OpenAI (hasta junio de 2026) | | Fecha de corte de conocimiento | 1 de junio de 2024 (hasta junio de 2026) | | Límite de velocidad de solicitudes | Clasificado por niveles de OpenAI; el nivel gratuito no soporta en la tabla de velocidad publicada por OpenAI (hasta junio de 2026) | | Soporte de ajuste fino | La página de modelos de OpenAI indica que no soporta (hasta junio de 2026) | | Soporte de salida en streaming | La página de modelos de OpenAI y la documentación de chat-completions de Gate.AI soportan streaming (hasta junio de 2026) | | Soporte para API en lote | Soporta a través de v1/batch de OpenAI (hasta junio de 2026) | | Funciones/Invocación de herramientas | La página de modelos de OpenAI indica soporte (hasta junio de 2026) | | Salida estructurada/Modo JSON | La página de modelos de OpenAI soporta salida estructurada (hasta junio de 2026) | | Licencias/Restricciones de uso | Sujetos a los términos de OpenAI y Gate.AI; la página de modelos no especifica licencias exclusivas del modelo (hasta junio de 2026) |
¿Cuál es el valor principal de o3 en producción?
Cuando la tarea requiere un razonamiento profundo en lugar de respuestas rápidas, o3 es especialmente adecuado. Se puede usar para revisión de código compleja, análisis de diseño técnico, razonamiento matemático y científico, interpretación de documentos largos, y razonamiento con entrada que incluya gráficos, diagramas de flujo o capturas de pantalla. OpenAI lista que o3 soporta entrada de texto e imágenes, salida de texto, llamadas a funciones, salida estructurada, streaming y tokens de razonamiento.
En sistemas productivos, o3 es apto para flujos de trabajo donde el costo de respuestas superficiales supera el costo de razonamiento lento. Ejemplos incluyen revisión de arquitectura, borradores de políticas, descomposición de problemas científicos, soporte en depuración y planificación estructurada. Para decisiones sensibles, aún se recomienda combinar con recuperación, verificación, monitoreo y revisión humana.
¿Qué modalidades soporta o3?
| Modalidad | ¿Soporta? | Descripción | | --------------------- | --------- | ------------------------------------------------------------------------------------------------| | Entrada de texto | Sí | Soporta prompts, instrucciones, código y contenido de documentos (hasta junio de 2026) | | Salida de texto | Sí | Principal tipo de salida (hasta junio de 2026) | | Entrada de imagen | Sí | Soporta razonamiento visual y análisis de imágenes (hasta junio de 2026) | | Salida de imagen | No confirmado | La página del modelo solo lista salida de texto, no soporta salida nativa de imágenes (hasta junio de 2026) | | Entrada/Salida de audio | No | Listado como no soportado (hasta junio de 2026) | | Entrada/Salida de video | No | Listado como no soportado (hasta junio de 2026) |
La página de modelos de OpenAI para o3 indica que solo soporta entrada y salida de texto y entrada de imágenes, sin soporte nativo para audio o video.
¿Cuáles son las limitaciones de o3?
o3 no es la opción predeterminada para todos los cargas de trabajo de IA. Su diseño enfocado en razonamiento hace que sea más lento que modelos ligeros, y OpenAI marca la velocidad de o3 como “más lenta” en sus atributos de modelo.
Además, la ventana de contexto de o3 es de 200,000 tokens, la salida solo es de texto, no soporta audio ni video nativamente, y la página de modelos de OpenAI indica que no soporta ajuste fino. Su fecha de corte de conocimiento es 1 de junio de 2024, por lo que para temas de actualidad, precios, regulaciones, mercado o estado del producto, se requiere recuperación o verificación externa.
Esto refleja limitaciones generales de IA, y salvo que OpenAI declare explícitamente lo contrario, o3 puede generar contenido erróneo, incompleto o excesivamente confiado. Para ámbitos legales, médicos, financieros, de seguridad y cumplimiento, se recomienda revisión por profesionales.
¿Para qué aplicaciones es más adecuado o3?
| Escenario de aplicación | Razón por la que o3 es adecuado | Restricciones importantes | | ---------------------------------- | -------------------------------------------------------------- | ---------------------------------------------- | | Revisión de código compleja | Adecuado para razonamiento en múltiples pasos, incluyendo bugs, arquitectura y análisis de trade-offs | Más lento que modelos pequeños | | Análisis de documentación técnica | Capaz de manejar prompts largos y entrada de imágenes, como gráficos o diagramas de flujo | La ventana de 200K tokens, aunque grande, no es infinita | | Razonamiento científico y matemático | Diseñado para tareas de razonamiento de alta dificultad | La salida aún requiere verificación humana | | Razonamiento visual | Puede analizar imágenes y explicar hallazgos en texto | No proporciona salida nativa de imágenes | | Planificación estructurada | Adecuado para descomponer flujos de trabajo complejos | No apto para todos los flujos de chat de baja latencia |
¿Cómo se compara o3 con GPT-4o y Gemini 2.0 Flash?
| Dimensión de comparación | o3 | GPT-4o | Gemini 2.0 Flash | Escenarios de adaptación | | ----------------------------------- | -------------------------------------------------------- | ------------------------------------- | -------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------ | | Proveedor | OpenAI | OpenAI | Google | Elegir según preferencia ecológica: OpenAI para flujos o3/GPT-4o, Google para Gemini API o Vertex AI. | | Tipo de modelo | Modelo de razonamiento | Modelo multimodal general | Modelo multimodal rápido | o3 para razonamiento profundo en múltiples pasos, GPT-4o para tareas multimodales amplias, Gemini 2.0 Flash para velocidad y contextos largos. | | Ventana de contexto | 200,000 tokens | 128,000 tokens | 1 millón de tokens según Google | o3 para tareas de razonamiento largo, GPT-4o para cargas de trabajo multimodales estándar, Gemini 2.0 Flash para contextos extensos. | | Entrada de texto e imagen; salida de texto | Multimodal entrada; en fase inicial salida de texto | Soporte para texto e imagen en los tres; o3 más enfocado en razonamiento, GPT-4o más flexible, Gemini 2.0 Flash más rápido | | o3 para análisis profundo, GPT-4o para interacción multimodal flexible, Gemini 2.0 Flash para velocidad, contexto largo y ecosistema Google. | | Precio de API | $2 por millón de tokens de entrada / $8 por millón de salida | $2.50 por millón de tokens de entrada / $10 por millón de salida | La API de Gemini se cobra por nivel y SKU | o3 para calidad de razonamiento, GPT-4o para equilibrio multimodal, Gemini 2.0 Flash para alto volumen y bajo costo. | | Escenarios de adaptación | Razonamiento complejo, código, análisis técnico | Aplicaciones multimodales generales y asistentes flexibles | Velocidad y tareas con contexto largo multimodal | o3 para análisis profundo, GPT-4o para interacción flexible, Gemini 2.0 Flash para velocidad y ecosistema Google. |
GPT-4o, como referencia de multimodalidad general, soporta entrada de texto e imagen, salida de texto, ventana de contexto de 128,000 tokens, y cuesta $2.50/$10 por millón de tokens. Gemini 2.0 Flash soporta llamadas a herramientas nativas, entrada multimodal, salida de texto (en fase inicial), con ventana de 1 millón de tokens.
¿Cómo acceder a o3 a través de Gate.AI?
Gate.AI ofrece una API compatible con OpenAI, con URL base y modelo ID de Gate.AI como openai/o3. La documentación verifica autenticación con Bearer-token, formato compatible con OpenAI, pago por uso, POST /chat/completions para chat, GET /models para listar modelos. También indica que la ruta correcta es /openai/v1, no /v1.
Ejemplo en Python
python from openai import OpenAI import os
client = OpenAI( api_key=os.environ["GATE_AI_API_KEY"], base_url="", )
completion = client.chat.completions.create( model="openai/o3", messages=[ { "role": "system", "content": "Eres un asistente AI útil." }, { "role": "user", "content": "Analiza las ventajas y desventajas de usar un modelo de razonamiento para revisión de código." } ], )
print(completion.choices[0].message.content)
Ejemplo con curl
bash curl /chat/completions
-H "Authorization: Bearer $GATE_AI_API_KEY"
-H "Content-Type: application/json"
-d '{ "model": "openai/o3", "messages": [ { "role": "system", "content": "Eres un asistente AI útil." }, { "role": "user", "content": "Analiza las ventajas y desventajas de usar un modelo de razonamiento para revisión de código." } ] }'
Los desarrolladores también pueden listar los modelos disponibles antes de desplegar:
bash curl /models
-H "Authorization: Bearer $GATE_AI_API_KEY"
A través de Gate.AI, los desarrolladores pueden usar un modo de solicitud compatible con OpenAI para acceder a los modelos soportados, seleccionando explícitamente el modelo mediante el campo model. Este documento no combina los precios oficiales de OpenAI con la facturación de Gate.AI, a menos que Gate.AI publique claramente esa tarifa.
Preguntas frecuentes
¿Cuál es la ventana de contexto de o3?
OpenAI indica que la ventana de contexto de o3 es de 200,000 tokens, con una longitud máxima de salida de 100,000 tokens (hasta junio de 2026).
¿Cuál es el precio de o3?
OpenAI publica que o3 cuesta $2.00 por millón de tokens de entrada, $0.50 por millón de tokens en caché de entrada y $8.00 por millón de tokens de salida (hasta junio de 2026).
¿Cómo acceden los desarrolladores a o3 a través de Gate.AI?
Usando la URL base compatible con OpenAI de Gate.AI, autenticándose con GATE_AI_API_KEY y enviando solicitudes a chat-completions, con el ID de modelo openai/o3.
¿o3 es mejor que GPT-4o o Gemini 2.0 Flash?
No necesariamente. o3 es adecuado para tareas de razonamiento complejo, GPT-4o para flujos multimodales generales, y Gemini 2.0 Flash para velocidad y contextos largos multimodales.