A Microsoft finalmente entrou na corrida com um agente inteligente de 7 bilhões, o Fara-7B que pode ver imagens, operar o navegador e navegar, MIT open source, é bem interessante

Ver original
MeNews
Microsoft lança o primeiro modelo de agente inteligente controlado por computador com 7 bilhões de parâmetros, Fara-7B
AIMPACT mensagem, 16 de maio (UTC+8), a Microsoft lançou o Fara-7B, seu primeiro modelo de linguagem inteligente de 7 bilhões de parâmetros projetado especificamente para cenários de uso de computador.
O modelo utiliza uma arquitetura de decodificador multimodal, capaz de receber imagens de captura de tela e contexto de texto, prevendo diretamente cadeias de pensamento parametrizadas e ações operacionais.
Construído com base no Qwen 2.5-VL (7B), suporta um comprimento de contexto de 128k, treinado por 2,5 dias em 64 GPUs H100, lançado sob licença MIT em 24 de novembro de 2025.
O Fara-7B percebe entradas do navegador por captura de tela, combinando raciocínio interno e registro de estado histórico para prever a próxima ação e seus parâmetros (como coordenadas de clique), dependendo de um grande conjunto de dados sintéticos completos para treinamento.
O modelo consegue planejar e executar tarefas avançadas (como reservar um restaurante, solicitar um emprego, planejar
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado