DeepMind lanza asistente de investigación en matemáticas con IA: arquitectura de múltiples agentes supera a GPT-5.5Pro, además de resolver un problema previamente "indecible"

Según el monitoreo de Beating, Google DeepMind lanzó un co-matemático de IA, una plataforma de investigación interactiva de múltiples agentes para matemáticos.
Este sistema logró una precisión del 47.9% en el estándar de investigación más difícil actual, FrontierMath Tier 4 (resolviendo 23 de 48 problemas), superando directamente el récord anterior del GPT-5.5 Pro del 39.6%.
Este sistema no utilizó una nueva generación de base, sino que empleó directamente Gemini 3.1 Pro.
Este modelo, corriendo solo en Tier 4 sin ayuda, alcanzaba solo un 19%, pero con el marco de agentes, el rendimiento se duplicó o más.
DeepMind le construyó una arquitectura de múltiples capas: en la capa superior, un «coordinador de proyectos» divide las tareas de investigación en múltiples flujos de trabajo, que luego se distribuyen a sub-agentes encargados de la búsqueda de literatura, la escritura de código y el razonamiento.
Las demostraciones producidas deben pasar por una revisión en una ronda de «agentes revisores» compuesta por varios, y solo tras aprobarse pueden enviarse.
Este sistema de infraestructura pesada demuestra que, en el razonamiento matemático de élite, la organización puede extraer incrementos de capacidad que quizás sean mayores que los avances en modelos de nueva generación.
La prueba ciega fue realizada por Epoch AI, y para evitar trampas, el equipo de DeepMind no vio las preguntas en ningún momento, permitiendo 48 horas por problema.
El resultado no solo fue la primera posición, sino que el sistema también resolvió 3 problemas que todos los modelos anteriores no pudieron resolver.
Aunque se llama asistente, es más como un colega con imaginación.
El experto en teoría de grupos Marc Lackenby usó en su investigación real para resolver una conjetura pública en las notas de Kourovka con su ayuda.
Curiosamente, la estrategia inicial del sistema fue calificada como «defectuosa» por su propio agente de revisión, pero Lackenby detectó la ingeniosa idea oculta en la propuesta fallida, la completó por sí mismo y finalmente logró la demostración.
Actualmente, el co-matemático de IA solo está en prueba interna para unos pocos matemáticos.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado