GPT-5.6 Prueba secreta en auge: ChatGPT se vuelve increíblemente inteligente, los usuarios prueban y aplastan a Fable 5

Los usuarios de ChatGPT esta semana reportaron colectivamente una mejora significativa en la calidad de las respuestas, pero con un tiempo de respuesta notablemente más largo, lo que ha generado especulaciones fervientes sobre la prueba secreta por parte de OpenAI del próximo modelo de generación GPT-5.6. Desde la generación de juegos 3D con un clic hasta simulaciones de robots, varios desarrolladores han publicado comparativas en la plataforma X, afirmando que "el Pro 5.5 ha sido silenciosamente reemplazado por 5.6". Se rumorea que su lanzamiento oficial podría ser el 25 de junio, pero OpenAI hasta ahora ha guardado silencio.
(Resumen previo: Noam Shazeer, co-responsable de Google Gemini, abandona Google para unirse a OpenAI)
(Información adicional: La nueva versión Mythos de Anthropic ha finalizado su entrenamiento, y Sonnet 5 será lanzado esta semana)

Índice de este artículo

Alternar

  • Reacción colectiva de los usuarios: respuestas más lentas, calidad mucho mayor
  • Detalles filtrados emergen: aumento en Juice Value, actualización de la fecha límite de conocimiento
  • El silencio de OpenAI y su historial de "lanzamientos silenciosos"
  • La prisa por lanzar un nuevo modelo: la carrera de GLM-5.2, y las restricciones de exportación a Anthropic

Esta semana, los usuarios de ChatGPT de repente notaron que algo parecía diferente en la calidad de las conversaciones. No fue una percepción aislada, sino una gran cantidad de reportes de desarrolladores, creadores y evaluadores que apuntan en la misma dirección: OpenAI podría estar probando en secreto un nuevo modelo.

El desarrollador Anshu Chimala publicó el jueves en la plataforma X un video comparativo mostrando la diferencia en la calidad de la página de aterrizaje generada con un solo prompt, diciendo claramente: "Bueno, bueno, bueno, soy uno de los afortunados que pudo experimentar primero con GPT-5.6 Pro." Otro desarrollador, Dobroslav Radosavljevič, publicó en X que el modelo que usaba en Codex "se siente completamente diferente a 5.5", y las respuestas en la sección de comentarios se dividieron entre quienes creen firmemente y quienes mantienen reservas.

Reacción colectiva de los usuarios: respuestas más lentas, calidad mucho mayor

La característica más evidente en común es el tiempo. El desarrollador Conor Dart realizó una prueba generando un juego 3D con motor físico y control de cámara a partir de una sola instrucción, que le tomó más de una hora, mientras que normalmente GPT-5.5 Pro solo tarda unos 10 minutos. Escribió: "No es perfecto, pero lograr esto con una sola instrucción es realmente impresionante."

Chetas Lua, una figura en la comunidad de IA, también reportó en X una situación similar: al probar un robot de simulación, el tiempo de respuesta se extendió a entre 20 y 40 minutos, diciendo que ese ritmo "no lo había visto desde que GPT-5.5 salió". Además, afirmó: "GPT-5.6 Pro sigue superando a Fable 5 de Anthropic en pruebas 3D."

Sin embargo, no todas las pruebas son unánimes. El evaluador de IA Chris usó la misma instrucción de construcción de nave espacial para probar dos modelos: uno, sospechosamente GPT-5.6 Pro, tardó 87 minutos, mientras que GPT-5.5 Extra High solo 34 minutos con 42 segundos. Analizó: "Como mencioné antes, GPT-5.6 es una actualización progresiva y sólida respecto a 5.5, no un 'asesino' de Fable. Probablemente tendrá enfrentamientos en algunos benchmarks con Fable 5, pero en general no será claramente superior."

Detalles filtrados emergen: aumento en Juice Value, actualización de la fecha límite de conocimiento

A medida que la discusión se intensifica, comienzan a circular más filtraciones. Pankaj Kumar, un filtrador, detalló varias especificaciones: la fecha límite de conocimiento se ha adelantado a diciembre de 2025; se dice que la configuración de fuerza de razonamiento llamada "Juice Value" ha sido elevada de 768 a 960; y en algunas tareas, la capacidad de generación de SVG y diseño 3D supera a Fable 5. Aunque estas informaciones no han sido confirmadas por OpenAI, múltiples cuentas coinciden en describir capacidades de razonamiento más fuertes, una interfaz frontend incompleta y un código en desarrollo llamado "Kindle-Alpha".

El líder de opinión en IA Leo citó mensajes anónimos y publicó que GPT-5.6 "está siendo probado en secreto en algunas cuentas Pro, y cuando los usuarios seleccionan GPT-5.5 Pro, en realidad están usando 5.6", y predijo que su lanzamiento público sería el 25 de junio (jueves).

El silencio de OpenAI y su historial de "lanzamientos silenciosos"

No es la primera vez que OpenAI opta por un enfoque de "lanzamiento sin anuncio previo". Al revisar el proceso de lanzamiento de GPT-4.5, OpenAI también eligió reemplazar el modelo sin previo aviso, y solo confirmó discretamente cuando los usuarios notaron las diferencias. Esta estrategia de lanzamiento silencioso permite a la compañía recopilar datos reales de uso sin atraer demasiada atención, y también facilita hacer rollback en caso de problemas, evitando crisis de relaciones públicas.

A diferencia de Anthropic, que realiza lanzamientos con gran despliegue, Fable 5 y Mythos 5 tuvieron líneas de tiempo claras desde su entrenamiento hasta su lanzamiento oficial. OpenAI, en cambio, ha ido cada vez más por la vía de "hacer primero, anunciar después". Según informes, Jakub Pachocki, jefe de ciencia, dijo en reuniones internas que el nuevo modelo es una mejora significativa respecto a GPT-5.5, pero The Information solo reportó esto sin confirmar pruebas A/B ni fechas de lanzamiento.

Cabe señalar que Decrypt consultó a OpenAI sobre este asunto y no obtuvo respuesta hasta el cierre de esta edición.

La prisa por lanzar un nuevo modelo: la carrera de GLM-5.2 y las restricciones de exportación a Anthropic

Si OpenAI realmente está acelerando la introducción de su próxima generación de modelos insignia, hay una fuerte presión competitiva. El modelo de código abierto chino GLM-5.2, en la prueba FrontierSWE, solo quedó a un punto de Claude Opus 4.8 en puntuaciones, y ya ha superado directamente a GPT-5.5. Este indicador, que mide el rendimiento en tareas complejas durante horas en agentes de IA, se está convirtiendo en un nuevo estándar para evaluar capacidades reales de los modelos.

Por otro lado, Anthropic enfrenta dificultades internas. Su modelo insignia Mythos 5 y Fable 5 fueron retirados tras una orden de control de exportaciones del gobierno de EE. UU. el 12 de junio, debido a una vulnerabilidad de jailbreak controvertida. Esto no solo crea un vacío en el mercado de modelos de alta gama, sino que también le da a OpenAI una valiosa ventana de oportunidad: si puede lanzar GPT-5.6 antes de que Anthropic resuelva los problemas de exportación, podría llenar ese vacío.

Mientras tanto, el Wall Street Journal reportó que OpenAI evalúa reducir precios para desarrolladores y empresas, preparándose para una doble oferta pública inicial (IPO). La competencia se intensifica y la guerra de precios está en marcha; el momento del lanzamiento del nuevo modelo es crucial para la narrativa de capital de OpenAI.

Por más que la comunidad especule con entusiasmo, solo OpenAI puede confirmar la existencia de GPT-5.6. Sin embargo, los traders en el mercado de predicciones Polymarket ya no quieren esperar: al cierre de semana, el precio de los contratos que predicen su lanzamiento entre el 22 y el 28 de junio ha subido hasta 89%.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado