A Microsoft faz com que o GPT trabalhe em colaboração com o Claude, superando todas as concorrentes em desempenho

robot
Geração de resumo em curso

Notícia de Mars Finance: na segunda-feira, a Microsoft anunciou duas novas funcionalidades para o Copilot Researcher — Critique e Council — combinando o GPT da OpenAI e o Claude da Anthropic para uma mesma tarefa de investigação. A Critique utiliza um modo de colaboração em cadeia: o GPT é responsável por planear a investigação, recolher informação e gerar um primeiro rascunho, enquanto o Claude assume posteriormente o papel de revisor rigoroso, verificando a exactidão dos factos e a qualidade das citações; o Council, por sua vez, permite que os dois modelos gerem relatórios de forma independente e em paralelo, sendo depois um terceiro modelo de árbitro que compara as diferenças e sintetiza as divergências. No teste de referência DRACO, que abrange 100 tarefas de investigação complexas em 10 áreas, incluindo saúde, direito e tecnologia, o Copilot com Critique obteve 57,4 pontos, ficando cerca de 14% à frente do segundo lugar e muito acima dos 42,7 pontos obtidos com a execução individual do Claude Opus 4.6.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar