Исследователь Microsoft добился успеха в собственном бенчмарке Perplexity: обзор двойной модели в Frontier, Cowork запускает агента для длительных задач

robot
Генерация тезисов в процессе

Согласно мониторингу 1M AI News, Microsoft одновременно запустила две новые возможности для Microsoft 365 Copilot через Frontier (программа предварительного релиза для корпоративных пользователей, которая позволяет участникам опробовать функции Copilot до их официального запуска). Исследователь (встроенный агент Copilot для глубоких исследований) представил два новых режима совместной работы между несколькими моделями: Critique и Council. Critique сотрудничает с моделями от Anthropic и OpenAI: одна отвечает за планирование, извлечение и черновую подготовку, а другая специализируется на проверке и доработке, при этом Auto включено по умолчанию. Council работает аналогично: обе модели генерируют полные отчеты, которые затем суммируются отдельной моделью для рецензирования. Microsoft использует GPT-5.2 в качестве оценочной модели (самой строгой из трех оценочных методик в исходной статье), чтобы тестировать Critique на бенчмарке DRACO (он включает 100 сложных исследовательских вопросов в рамках 10 направлений, опубликованных исследователями Perplexity). Общий результат оказался на 7.0 балла выше, чем у лучшей системы в бенчмарке — Perplexity Deep Research (которая использует Claude Opus 4.6), что соответствует относительному улучшению на 13.88%. Critique не был включен в исходную статью DRACO, и эти данные Microsoft получила в ходе самопроверки по тому же протоколу оценки. Copilot Cowork предназначен для более длительных задач с несколькими шагами: сначала он генерирует план на основе целей, затем продвигается шаг за шагом между инструментами и документами, отображая прогресс на протяжении всего процесса, позволяя пользователям вмешиваться в любой момент. Microsoft назвала Capital Group в качестве раннего примера использования, заявив, что она применялась для планирования проектов, составления графиков, создания deliverable и подготовки обзоров для руководства.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить