A 17 de fevereiro, a Microsoft lançou a versão mais recente do Quadro de Análise Visual OmniParser, V2.0, no seu site oficial, que transforma modelos como DeepSeek-R1, GPT-4o e Qwen-2.5VL em Agentes de IA utilizáveis em computadores. Comparado com a versão V1, o V2 tem uma maior precisão na deteção de elementos de IU interativos mais pequenos e uma velocidade de raciocínio mais rápida, Gota a latência em 60%. No teste de Referência de Agentes de alta resolução ScreenSpot Pro, a precisão do V2+GPT-4o atingiu um surpreendente 39,6%, enquanto a precisão original do GPT-4o era apenas 0,8%, o que representa um aumento significativo. Além do V2, a Microsoft também abriu o omnitool, que é um sistema Windows baseado em Docker, abrangendo funcionalidades como compreensão de tela, localização, planeamento e execução de ações, sendo também uma ferramenta fundamental para transformar grandes modelos em Agentes.
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
2 gostos
Recompensa
2
4
Partilhar
Comentar
0/400
GateUser-d6ca73f1
· 02-23 07:30
Pode aceder à área de negociação spot?
Responder0
GateUser-50c1e0dd
· 02-17 03:19
Bull Run 🐂
Responder0
GateUser-50c1e0dd
· 02-17 02:39
Bull Run 🐂
Responder0
Mmhreyan8513
· 02-17 00:26
Ape In 🚀Bull Run 🐂HODL Tight 💪1000x Vibes 🤑1000x Vibes 🤑HODL Tight 💪Bull Run 🐂Ape In 🚀
Estrutura de inovação Código aberto da Microsoft: transformando o DeepSeek em um Agente de IA
A 17 de fevereiro, a Microsoft lançou a versão mais recente do Quadro de Análise Visual OmniParser, V2.0, no seu site oficial, que transforma modelos como DeepSeek-R1, GPT-4o e Qwen-2.5VL em Agentes de IA utilizáveis em computadores. Comparado com a versão V1, o V2 tem uma maior precisão na deteção de elementos de IU interativos mais pequenos e uma velocidade de raciocínio mais rápida, Gota a latência em 60%. No teste de Referência de Agentes de alta resolução ScreenSpot Pro, a precisão do V2+GPT-4o atingiu um surpreendente 39,6%, enquanto a precisão original do GPT-4o era apenas 0,8%, o que representa um aumento significativo. Além do V2, a Microsoft também abriu o omnitool, que é um sistema Windows baseado em Docker, abrangendo funcionalidades como compreensão de tela, localização, planeamento e execução de ações, sendo também uma ferramenta fundamental para transformar grandes modelos em Agentes.