GPT-5.4 Pro alcanza 150 de CI en la prueba MESNA de Noruega mientras OpenAI rompe su propio récord

Haz que CryptoSlate sea el preferido en

El último modelo GPT-5.4 Pro de OpenAI ya ha logrado una puntuación de IQ superior al 99,96% de todas las personas, ofreciendo a los mercados una señal fresca de que las mejoras en la capacidad de la IA están empezando a superar el ruido habitual del ciclo de producto.

El GPT-5.4 Pro de OpenAI alcanza 150 en el benchmark público de IQ mientras los mercados entran en otra semana cargada de variables macro

El ranking público de TrackingAI ahora sitúa a OpenAI GPT-5.4 Pro en una puntuación de IQ de 150, un salto significativo frente a la puntuación de 136 que OpenAI’s o3 publicó en la prueba de Mensa Norway el año pasado.

El salto llega en un momento en el que la atención del mercado se ha estrechado en torno a Irán, la energía, la debilidad laboral y el próximo dato de inflación. Eso plantea una pregunta distinta de cara a la semana: ¿qué tan rápido se está acumulando la inteligencia de las máquinas y cuándo esa aceleración empezará a solaparse con el posicionamiento económico?

Por qué esto importa: Un movimiento de 136 a 150 en un benchmark ampliamente entendido comprime un cambio complejo de capacidad en una señal simple. Para las empresas, esa señal se traduce directamente en decisiones sobre automatización, presupuestos de software y planificación de dotación de personal. Para los mercados, añade otra variable junto a tipos, inflación y expectativas de crecimiento.

OpenAI presentó GPT-5.4 como su modelo de frontera más capaz y eficiente para trabajo profesional, con una codificación más sólida, uso de herramientas y uso de computadoras, y una ventana de contexto de hasta 1 millón de tokens. En el mismo lanzamiento, OpenAI dijo que GPT-5.4 logró un nuevo estado del arte en GDPval y superó el rendimiento humano en OSWorld-Verified.

Esos benchmarks son independientes de una prueba pública de IQ, pero la dirección del avance coincide. La capacidad está aumentando en sistemas de medición separados, y ese incremento ya es lo bastante rápido como para influir en el presupuesto, los planes de contratación, el diseño de flujo de trabajo y el gasto en software.

Una puntuación de 150 en un benchmark tipo IQ público comprime un movimiento más amplio de capacidad en una única señal portátil. El número es fácil de entender incluso antes de que se debata la metodología.

El resultado previo de o3 en Mensa estableció el benchmark y sus límites. La ventana de contexto de un millón de tokens de GPT-4.1 mostró cómo OpenAI estaba ampliando la utilidad del modelo en código y tareas documentales a largo plazo, mientras que nuestro análisis del creciente ciclo de capital de OpenAI vinculó el progreso del modelo con la expansión del hardware, los ciclos de financiación y la demanda de infraestructura.

En conjunto, esos desarrollos sitúan la puntuación de IQ más reciente dentro de un contexto comercial y económico más amplio. Un movimiento de 136 a 150 en un benchmark público es llamativo por sí solo. Un movimiento de 136 a 150 mientras OpenAI impulsa más el uso de herramientas, el uso de computadoras, la productividad empresarial y la infraestructura intensiva en capital conlleva implicaciones más amplias.

Los benchmarks públicos de IQ son limitados, pero la curva de capacidad sigue moviéndose hacia arriba

Las pruebas tipo IQ públicas siguen siendo instrumentos imperfectos para medir modelos de frontera. TrackingAI ejecuta un benchmark público estilo Mensa y también mantiene una prueba privada offline más exigente.

Las pruebas tipo IQ comprimen un segmento estrecho del rendimiento cognitivo en un único número, ocultando variaciones entre tipos de razonamiento, manejo del contexto, creatividad y resolución de problemas en el mundo real.

Tanto para la IA como para los humanos, las puntuaciones son sensibles al diseño de la prueba, la exposición al entrenamiento y la familiaridad con patrones, lo que las convierte en un proxy ruidoso de la capacidad general.

Un IQ de 150 se ubica en la cola superior extrema de la distribución, a menudo asociada con personas como Albert Einstein o Richard Feynman. En términos prácticos, implica una abstracción muy rápida, un fuerte reconocimiento de patrones y la capacidad de navegar problemas complejos de múltiples pasos con orientación limitada.

La plataforma informa las puntuaciones como promedios móviles sobre finalizaciones recientes, y la metodología plantea preguntas familiares sobre la estructura de los prompts, la reproducibilidad, la contaminación del conjunto de entrenamiento y la familiaridad con el formato. Esas preocupaciones ya eran visibles cuando o3 llegó a 136, y siguen activas ahora que GPT-5.4 Pro está en 150.

Lectura relacionada

Las puntuaciones de o3 de OpenAI: 136 en la prueba de Mensa Norway, superando al 98% de la población humana

El modelo o3 de OpenAI alcanza un IQ a nivel Mensa en pruebas independientes.

17 abr, 2025 · Liam ‘Akiba’ Wright

Incluso con esas limitaciones, el patrón más amplio se ha vuelto más difícil de descartar. Un solo resultado de benchmark aislado puede explicarse como una rareza. Un conjunto de ganancias en pruebas públicas tipo IQ, en programación, en uso del navegador, en navegación por escritorio y en rendimiento de trabajo del conocimiento pesa más analíticamente.

El último ranking de TrackingAI sitúa a GPT-5.4 Pro en la cima de su tablero público de IQ por delante de todos los modelos Cluade, Gemini, Qwen y Grok, ofreciendo un benchmark público externo y legible que encaja rápidamente en el debate más amplio sobre la capacidad.

Pocas personas necesitan una comprensión detallada del diseño de benchmarks para entender que 150 está en un rango raro y que los inversores no necesitan aceptar cada premisa detrás de una prueba tipo IQ para reconocer que un salto de este tamaño sugiere aceleración en lugar de deriva.

Gráfico titulado “Resultados de la prueba de IA IQ” que muestra las puntuaciones medias de IQ de Mensa Norway para los principales modelos de IA en una curva de campana, con las variantes de GPT-5.4 de OpenAI trazadas cerca del extremo superior del rango.

Los compradores empresariales tampoco necesitan creer que el IQ equivale a la inteligencia general para ver que los sistemas con mejor reconocimiento de patrones, mejor uso de herramientas y mejor manejo de tareas a largo horizonte se están moviendo hacia un territorio económicamente útil, extendiéndose mucho más allá de resolver acertijos.

Esto apunta a sistemas que pueden buscar, planificar, verificar, navegar y producir trabajo real en contextos extendidos. En ese escenario, la puntuación de IQ funciona menos como un número de novedad y más como una señal de la densidad del razonamiento de frontera.

También hay valor competitivo en el propio ranking. Una posición de liderazgo en un benchmark público refuerza el lugar de OpenAI en la carrera por el liderazgo visible en capacidad, especialmente en un momento en el que la diferenciación de los modelos se vuelve más difícil de discernir solo a partir de notas de arquitectura.

El liderazgo en benchmarks comprime la complejidad en una jerarquía simple. Ofrece a los desarrolladores una señal, a los compradores empresariales un relato y a los inversores otro proxy de dónde se encuentra actualmente el frente de capacidad.

CryptoSlate Resumen diario

Señales diarias, cero ruido.

Titulares que mueven el mercado y contexto entregados cada mañana en una lectura breve.

5 minutos de digestión 100k+ lectores

Dirección de email

Obtén el resumen

Gratis. Sin spam. Cancela cuando quieras.

Vaya, parece que hubo un problema. Inténtalo de nuevo.

Ya estás suscrito. Bienvenido a bordo.

El ascenso del benchmark de OpenAI está empezando a solaparse con la semana económica que viene

La semana próxima sigue atravesando variables macro. El calendario de la Oficina de Estadísticas Laborales deja claro las próximas publicaciones clave: las actas del FOMC de la reunión del 17 al 18 de marzo, con vencimiento el 8 de abril; el Índice de Precios al Consumidor de marzo, con vencimiento el 10 de abril; y el Índice de Precios al Productor de marzo, con vencimiento el 14 de abril.

Ese calendario mantiene a la vista la ansiedad por tipos, inflación y crecimiento, pero por debajo de esa superficie, se está formando un segundo carril económico, y OpenAI está cerca de su centro.

El crecimiento de la capacidad en IA de frontera se cruza cada vez más con la asignación de capital. Un modelo que sube en pruebas públicas de razonamiento mientras también mejora en codificación, búsqueda y uso de computadoras cambia la forma en que las empresas piensan sobre la redefinición de flujos de trabajo. Cambia lo que los compradores de software esperan de copilotos y agentes. Cambia qué tan rápido las empresas pasan de la experimentación al despliegue.

Jack Dorsey publicó recientemente que Block se está moviendo “de la jerarquía hacia la inteligencia”, usando IA para hacerse cargo del trabajo de coordinación que antes gestionaban capas de gestión, a medida que la empresa se reorganiza en torno a contribuyentes individuales, personas responsables directamente y entrenadores-jugadores

El crecimiento de la capacidad también cambia qué tareas pueden extraerse de las estructuras de costos laborales y reasignarse a software. Estos efectos se mueven primero por canales más estrechos, incluidos flujos de trabajo documentales, flujos de trabajo de hojas de cálculo, soporte al cliente, tareas de investigación, automatización del navegador, operaciones internas, generación de código y bucles de verificación.

La dirección comercial de OpenAI refuerza esa interpretación. En los materiales de lanzamiento de GPT-5.4, la empresa describió un rendimiento más sólido en trabajo profesional, una búsqueda de herramientas más fuerte, uso nativo de computadora y mejoras en el trabajo del conocimiento medido en benchmarks en ocupaciones que se corresponden directamente con la economía de EE. UU.

Eso sitúa el crecimiento de la capacidad de la IA dentro de una pregunta de mercado familiar: a dónde fluyen los desembolsos si estos sistemas continúan mejorando a este ritmo.

La respuesta se extiende más allá de los ingresos por suscripción del modelo hacia la demanda de nube, chips, centros de datos, redes, energía, licencias de software y supuestos de productividad laboral. El creciente ciclo de capital de OpenAI ya refleja parte de esa estructura, y la ganancia del benchmark añade una señal pública más simple por encima.

Ese solapamiento es lo que le da al resultado más reciente una relevancia más amplia durante una semana cargada de macro. Los mercados ya conocen la configuración del IPC. Los mercados ya saben que los precios del petróleo pueden alimentar expectativas de inflación. Los mercados ya saben que las actas de la Fed se analizarán en busca del tono de la política.

Pero, ¿el crecimiento de la inteligencia en sí mismo empieza a comportarse como una variable macro? Las ganancias más rápidas de capacidad pueden alterar los planes de gasto de las empresas, intensificar la presión competitiva en funciones de cuello blanco, respaldar mayores desembolsos en infraestructura y fortalecer el caso para el gasto de capital vinculado a IA incluso en un entorno de crecimiento nominal más lento.

Cuando TrackingAI muestra GPT-5.4 Pro en 150, el número cae dentro de un mercado que ya ve a OpenAI como más que un laboratorio. Es una empresa de plataforma, una empresa de despliegue, un cliente de infraestructura y un generador de señales para sectores adyacentes.

La próxima prueba está en dos lugares a la vez. Uno es metodológico: los benchmarks públicos tipo IQ seguirán atrayendo escrutinio, y deberían. El otro es económico: los mercados decidirán, paso a paso, si saltos de capacidad de este tamaño merecen cotizarse junto con datos laborales, expectativas de tipos y tendencias de gasto de capital.

El último ascenso de OpenAI en benchmarks acerca esa decisión. La puntuación es compacta, legible y fácil de difundir. Su relevancia más profunda proviene del mismo lugar que el impulso de producto más amplio de la empresa; el frente sigue subiendo, y la huella económica de ese avance se vuelve más difícil de mantener en una categoría separada.

Mencionado en este artículo

OpenAI Anthropic Google X Sam Altman

Publicado en

Destacado EE. UU. Tecnología Cultura IA Comunidad

Contexto

Cobertura relacionada

Cambia categorías para profundizar o ganar contexto más amplio.

Noticias locales de EE. UU.      IA Categoría principal      Comunicados de prensa Newswire  

Análisis

Por qué Bitcoin saltó brevemente por encima de $70.000 con esperanzas de acuerdos sobre Irán mientras la amenaza de Hormuz de Trump mantiene el repunte frágil

Cerca de $112 el petróleo y se avecinan el IPC y la Fed, que podrían decidir si este rebote sobrevive o se convierte en una caída más profunda.

2 mins hace

Análisis

Citadel Securities y Fidelity acaban de hacer su movimiento más claro hasta ahora para reconstruir cripto como Wall Street

La presentación podría mover más el back end del trading cripto hacia manos supervisadas a nivel federal si las instituciones siguen.

4 horas ago

Wall Street ve una apertura de $10 billones mientras Washington reescribe las reglas de 401(k)

Análisis · 12 horas ago

El fuerte informe de empleo de EE. UU. retrasa el alivio de la Fed mientras Bitcoin se enfrenta a su próxima prueba macro

Análisis · 1 día ago

El comercio de tesorería de Bitcoin enfrenta una prueba de estrés cuando la presión de la deuda dispara las ventas

Análisis · 2 días ago

Los derivados de Bitcoin lanzan una advertencia cuando el mercado de $46B se retira del rally del alto el fuego con Irán

Análisis · 2 días ago

IA

El proyecto de IA cripto OpenServ afirma superar a OpenAI en comparaciones directas de benchmark

La plataforma AI-cripto está haciendo afirmaciones más grandes contra OpenAI, elevando el nivel de exigencia para pruebas, despliegues y credibilidad del token.

2 horas ago

Tecnología

Ripple impulsa una blockchain más privada para bancos y añade verificaciones de código de IA mientras crecen los temores de que podría dejar el precio de XRP atrás

Ripple busca revolucionar la blockchain institucional con funciones mejoradas de privacidad y seguridad de IA en XRPL.

1 semana ago

Los ganadores cripto de la IA no son monedas de IA, ya que los agentes empiezan a gastar de forma autónoma

Análisis · 1 semana ago

El reinicio de la IA ya está en marcha mientras los despidos se aceleran y un grupo es el más golpeado

IA · 4 semanas ago

¿Puede la cripto protegernos contra la creciente red de agentes económicos de IA?

IA · 4 semanas ago

La IA está contratando más desarrolladores senior mientras borra en silencio los empleos que la crean

IA · 1 mes ago

CoinRabbit reduce las tasas de préstamos cripto para préstamos en XRP y 300+ activos

Con las tasas de préstamo ahora empezando en 11,95%, CoinRabbit está expandiendo el endeudamiento con respaldo de cripto a menor costo a través de XRP y 300+ activos compatibles.

3 horas ago

ADI Chain anuncia ADI Predictstreet como socio de mercado de predicciones para la Copa Mundial FIFA 2026

Respaldado por ADI Chain, ADI Predictstreet debutará en el escenario más grande del fútbol como socio oficial de mercado de predicciones de la Copa Mundial FIFA 2026.

3 días ago

El intercambio BTCC fue nombrado socio regional oficial del equipo nacional argentino

PR · 4 días ago

Encrypt llega a Solana para impulsar mercados de capital cifrados

PR · 6 días ago

Ika llega a Solana para impulsar mercados de capital sin intermediarios

PR · 6 días ago

El lanzamiento de la red principal TxFlow L1 marca una nueva fase para las finanzas on-chain multiaplicación

PR · 6 días ago

Disclaimer

Las opiniones de nuestros autores son únicamente suyas y no reflejan la opinión de CryptoSlate. Ninguna de la información que lees en CryptoSlate debe tomarse como asesoramiento de inversión, ni CryptoSlate respalda ningún proyecto que pueda mencionarse o enlazarse en este artículo. La compra y el trading de criptomonedas deben considerarse una actividad de alto riesgo. Por favor, realiza tu propia diligencia debida antes de tomar cualquier acción relacionada con el contenido de este artículo. Finalmente, CryptoSlate no asume ninguna responsabilidad si pierdes dinero operando criptomonedas. Para más información, consulta nuestras exenciones de responsabilidad de la empresa.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado