Microsoft Researcher triunfa en la referencia propia de Perplexity: revisión de doble modelo en Frontier, Cowork abre de manera sincronizada el agente para tareas largas

robot
Generación de resúmenes en curso

Noticias de CoinJie, según el seguimiento de 1M AI News, Microsoft ha abierto de forma simultánea dos nuevas capacidades de Microsoft 365 Copilot a través de Frontier (plan de pre-lanzamiento para usuarios empresariales para probar antes las funciones de Copilot que aún no han salido oficialmente). Researcher (el agente de investigación en profundidad integrado en Copilot) añadió dos tipos de modos de colaboración entre múltiples modelos: Critique y Council. Critique colabora con modelos de Anthropic y de los modelos de OpenAI bajo su paraguas: uno se encarga de planificar, buscar y redactar, y el otro se especializa en revisar y refinar. Cuando se selecciona Auto, se habilita por defecto. Council también ejecuta en paralelo dos modelos: cada uno genera un informe completo, y luego un modelo de evaluación por separado recopila las similitudes y diferencias. Microsoft usa GPT-5.2 como modelo de evaluación (el más estricto de los tres métodos de evaluación del artículo original) y prueba Critique en el benchmark DRACO (100 complejos problemas de investigación publicados por investigadores de Perplexity, que cubren 10 áreas). En conjunto, la puntuación supera en 7.0 puntos al sistema mejor del benchmark, Perplexity Deep Research (que utiliza Claude Opus 4.6), con una mejora relativa del 13.88%. El artículo original de DRACO no incluye Critique; estos datos que Microsoft obtuvo son el resultado de pruebas realizadas por su parte con el mismo protocolo de evaluación. Copilot Cowork está orientado a trabajos más largos y de múltiples pasos: primero genera un plan según el objetivo y luego avanza paso a paso a través de herramientas y archivos, mostrando el progreso durante el proceso, y el usuario puede intervenir en cualquier momento. Microsoft, citando a Capital Group como caso para pruebas tempranas, afirma que ya se ha utilizado para planificación de proyectos, programación, creación de entregables y preparación de revisiones para ejecutivos.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado