Estrutura de inovação Código aberto da Microsoft: transformando o DeepSeek em um Agente de IA

robot
Geração do resumo em andamento

A 17 de fevereiro, a Microsoft lançou a versão mais recente do Quadro de Análise Visual OmniParser, V2.0, no seu site oficial, que transforma modelos como DeepSeek-R1, GPT-4o e Qwen-2.5VL em Agentes de IA utilizáveis em computadores. Comparado com a versão V1, o V2 tem uma maior precisão na deteção de elementos de IU interativos mais pequenos e uma velocidade de raciocínio mais rápida, Gota a latência em 60%. No teste de Referência de Agentes de alta resolução ScreenSpot Pro, a precisão do V2+GPT-4o atingiu um surpreendente 39,6%, enquanto a precisão original do GPT-4o era apenas 0,8%, o que representa um aumento significativo. Além do V2, a Microsoft também abriu o omnitool, que é um sistema Windows baseado em Docker, abrangendo funcionalidades como compreensão de tela, localização, planeamento e execução de ações, sendo também uma ferramenta fundamental para transformar grandes modelos em Agentes.

Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
  • Recompensa
  • 4
  • Compartilhar
Comentário
0/400
GateUser-d6ca73f1vip
· 02-23 07:30
Pode aceder à área de negociação spot?
Responder0
GateUser-50c1e0ddvip
· 02-17 03:19
Bull Run 🐂
Responder0
GateUser-50c1e0ddvip
· 02-17 02:39
Bull Run 🐂
Responder0
Mmhreyan8513vip
· 02-17 00:26
Ape In 🚀Bull Run 🐂HODL Tight 💪1000x Vibes 🤑1000x Vibes 🤑HODL Tight 💪Bull Run 🐂Ape In 🚀
Responder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)