¡La revelación explosiva del núcleo GPT-5.4! Podría tener memoria permanente y una inferencia extrema en auge

Si sientes que últimamente el mundo de la IA está un poco tranquilo y sin emoción, quizás solo sea la calma antes de la tormenta.

Según varias fuentes, ¡GPT-5.4 ya está en la línea de salida!

En LMArena, ya se ha visto la presencia de GPT-5.4.

Justo ahora, el medio extranjero The Information filtró muchos detalles clave sobre GPT-5.4.

La noticia es impactante: tiene un contexto más largo, modelos de razonamiento más extremos e incluso, ¡podría tener memoria permanente!

Si, como se rumorea, todo esto es cierto, esta generación de modelos no sería solo una simple actualización, sino un salto enorme en capacidades y forma.

Pruebas anticipadas de GPT-5.4, código filtrado y revelado

Recientemente, GPT-5.4 ha estado filtrándose por todas partes.

Desde errores en Codex, PR en GitHub, hasta capturas enviadas por empleados por error, en pocos días GPT-5.4 ha sido «expuesto» al menos tres veces.

Y todo esto, sin que OpenAI lo haya querido revelar.

Lo primero fue un límite de seguridad en Codex, cuando el desarrollador Corey Noles usaba Codex y el sistema le devolvió un error con una cadena muy larga de nombres de modelos:

Lo más importante de esa cadena es las primeras tres letras: gpt-5.4.

En resumen, esa cadena puede considerarse como un ID interno de despliegue de OpenAI, que traducido sería «una versión de prueba real en despliegue de GPT-5.4.»

Luego, en el repositorio oficial de Codex de OpenAI, aparecieron dos Pull Requests:

Uno decía:

Y otro más directo:

Parece que OpenAI añadió un interruptor de «Modo Rápido» para GPT-5.4. Horas después, ambos PR fueron forzados a eliminarse mediante push forzado.

Luego, ocurrió algo aún más dramático: un empleado del equipo de Codex de OpenAI, Tibo, publicó en redes sociales una captura de pantalla. En ella, en el selector de modelos, claramente aparece GPT-5.4.

Poco después, esa publicación fue eliminada.

Luego, otros desarrolladores reportaron haber visto cadenas similares en los errores de Codex.

Esto confirma aún más que GPT-5.4 ya está desplegado en servidores internos y en pruebas A/B reales.

¿Un solo prompt genera 6000 líneas de código?

Además, algunos desarrolladores ya reportan un cambio evidente: ¡la velocidad!

Algunos testers dicen que la inferencia del modelo es mucho más rápida, genera código más largo e incluso, con un solo prompt, puede producir más de 6000 líneas de código.

Lo cual antes parecía imposible.

También descubrieron una nueva función: el Modo Rápido.

Esto podría significar que OpenAI está probando nuevas arquitecturas de inferencia, como pipelines de latencia multinivel o modelos con diferentes velocidades.

Además, se ha detectado una nueva interfaz en el modelo: algunos usuarios indican que si ven botones de «Me gusta» o «No me gusta» junto a los resúmenes de inferencia (Chain-of-Thought), puede que su cuenta ya esté asignada a la versión de prueba GPT-5.4.

Modo de razonamiento extremo, rendimiento explosivo

La filtración de The Information también coincide con toda esta información.

Lo más destacado es este modo de razonamiento extremo — Extreme Reasoning Mode.

Los modelos tradicionales tienen tiempos de pensamiento limitados, pero este modo extremo lleva el rendimiento al máximo, permitiendo que el modelo dedique más tiempo y recursos para resolver problemas difíciles, realizando inferencias más profundas.

Curiosamente, según investigaciones, muchos usuarios comunes de ChatGPT no están muy interesados en funciones de razonamiento.

Desde una perspectiva comercial, esta función tampoco sería muy útil, ya que las empresas quieren respuestas rápidas de la IA.

Por eso, que OpenAI siga valorando tanto la capacidad de razonamiento parece una motivación más pura.

Pero, para la comunidad científica y algunos clientes empresariales, esto es una gran noticia.

Claramente, en investigación científica, muchos usuarios están dispuestos a dejar que un modelo funcione durante horas o incluso días en problemas valiosos.

Al mismo tiempo, algunas empresas también necesitarán la mayor capacidad de razonamiento y rendimiento en tareas prolongadas de GPT-5.4 para automatizar procesos complejos.

Según filtraciones, este modo de razonamiento extremo será muy potente, y las expectativas están por las nubes.

Contexto duplicado, ¡hasta 1M de tokens!

Para GPT-5.4, esto representa otra actualización muy potente: la ventana de contexto pasa de 400,000 tokens a un millón de tokens.

De esta forma, GPT-5.4 podrá manejar documentos de decenas de miles de palabras, analizar libros completos o grandes bases de código y datos.

Esto también permite que el modelo iguale en capacidades de contexto largo a Gemini de Google y Claude de Anthropic.

Después de todo, otras compañías ya alcanzaron los 1 millón de tokens en su ventana de contexto, y GPT-5.4 finalmente cierra esa brecha.

Incluso, filtraciones más exageradas que The Information indican que la ventana de contexto podría llegar a los 2 millones de tokens.

GPT-5.4, experto en «tareas largas»

Otra filtración señala que GPT-5.4 también mejora en tareas que requieren horas de procesamiento.

Es decir, puede recordar mejor los detalles de las solicitudes del usuario en múltiples pasos, así como las restricciones de lo que puede o no puede hacer, y cometer menos errores.

Claramente, esto será muy útil para herramientas de programación como Codex, que usan IA para automatizar tareas complejas y prolongadas.

Además, esta capacidad de tareas largas es clave para los Agentes de IA.

Estos agentes podrán leer requisitos, buscar información, escribir código, arreglar errores, sin que cada paso requiera una nueva instrucción humana.

¿GPT-5.4 tendrá memoria permanente?

Y llega la filtración más loca: ¡GPT-5.4 podría tener memoria permanente!

Un ingeniero publicó esta filtración en X, causando revuelo en la comunidad de IA, y Garry Tan, inversor en Silicon Valley y fundador de YC, rápidamente la compartió.

En esa publicación, el filtrador describe el «estado persistente» de GPT-5.4.

Jeff Dean mencionó esto en el podcast latentspacepod, mostrando que los laboratorios de IA están pensando en esa dirección.

Se especula que OpenAI ya ha descubierto cómo integrar de manera efectiva y a gran escala los modelos de espacio de estado (SSM) con Transformers.

La clave está en que el diseño de SSM permite transmitir estados ocultos en cada paso, con una complejidad lineal, a diferencia de los Transformers, que crecen cuadráticamente con la longitud del contexto.

Esto coincide con rumores: se dice que GPT-5.4 podría tener una ventana de contexto de 2 millones de tokens.

El concepto de estado persistente significa que el IA pasaría de depender solo de la memoria a corto plazo, como en la película Memory Fragment con Guy Pearce, a tener una memoria estable y duradera, como en Rain Man con Dustin Hoffman.

En otras palabras, dotaría a la IA de una verdadera memoria a largo plazo.

Si esto se logra, sería un avance tecnológico enorme.

Presión creciente, OpenAI se ve obligado a actualizar mensualmente

Claramente, tras GPT-5, OpenAI ha cambiado su ritmo y ahora actualiza con mayor frecuencia.

Este año, ya hemos visto GPT-5.1, GPT-5.2 y pronto GPT-5.4, con un ritmo casi mensual.

Se nota que OpenAI está siendo presionada por la competencia.

Actualmente, ChatGPT tiene 910 millones de usuarios activos semanales, una cifra impresionante, pero aún lejos del objetivo de 1,000 millones de usuarios activos de OpenAI.

Google, Anthropic y otros competidores siguen avanzando en contexto largo, agentes y razonamiento.

Si GPT-5.4 realmente tiene 1 millón de tokens de contexto, razonamiento extremo y memoria persistente, la IA podría convertirse en un agente que trabaja continuamente.

Y si GPT-5.4 realmente empieza a «recordar cosas», sería un punto clave en la historia de los grandes modelos.

El punto de singularidad está cerca, y estamos acelerando a toda velocidad. ¿Estás listo?

Fuente: Xinzhiyuan

Aviso de riesgos y exención de responsabilidad

El mercado tiene riesgos, invierta con prudencia. Este artículo no constituye consejo de inversión personal ni considera objetivos, situación financiera o necesidades específicas del usuario. El usuario debe evaluar si las opiniones, puntos de vista o conclusiones aquí expresadas se ajustan a su situación particular. La responsabilidad por inversiones recae en el inversor.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado