A Microsoft lançou o primeiro modelo de agente inteligente controlado por computador com 7B de parâmetros, Fara-7B

robot
Geração de resumo em curso
AIMPACT mensagem, 16 de maio (UTC+8), a Microsoft lançou o Fara-7B, seu primeiro modelo de linguagem inteligente de 7 bilhões de parâmetros projetado especificamente para cenários de uso de computador.
O modelo utiliza uma arquitetura de decodificador multimodal, capaz de receber imagens de captura de tela e contexto de texto, prevendo diretamente cadeias de pensamento parametrizadas e ações operacionais.
Construído com base no Qwen 2.5-VL (7B), suporta um comprimento de contexto de 128k, treinado por 2,5 dias em 64 GPUs H100, lançado sob licença MIT em 24 de novembro de 2025.
O Fara-7B percebe entradas do navegador por captura de tela, combinando raciocínio interno e registro de estado histórico para prever a próxima ação e seus parâmetros (como coordenadas de clique), dependendo de um grande conjunto de dados sintéticos completos para treinamento.
O modelo consegue planejar e executar tarefas avançadas (como reservar restaurantes, solicitar empregos, planejar viagens, etc.).
No que diz respeito ao alinhamento de segurança, utiliza métodos de treinamento robusto, possui capacidade de reconhecimento de pontos-chave, consegue rejeitar sete categorias de tarefas que violem políticas de uso e pausa operações ao detectar informações pessoais ou ao completar compras em pontos críticos.
Os usuários podem implantar e interagir através de repositórios no GitHub, vllm e a ferramenta fara-cli, sendo principalmente aplicado em tarefas automatizadas na web.
(Origem: InFoQ)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Pragmatists
· 3h atrás
O parâmetro é apenas 7B, o custo de inferência é controlável, e equipes pequenas e médias também podem jogar.
Ver originalResponder0
ReflectionsOnTheStreetCorner
· 6h atrás
Agente multimodal de 7B em execução, a comunidade de implantação local está em êxtase
Ver originalResponder0
YieldTuningFork
· 6h atrás
A estratégia de código aberto da Microsoft nesta rodada foi excelente, a licença MIT é realmente atraente
Ver originalResponder0
OracleSkeptic
· 6h atrás
Treinamento com dados sintéticos completos é interessante, entendi como funciona o ciclo fechado de dados
Ver originalResponder0
TheProphetOfToast
· 6h atrás
Construído com base no Qwen 2.5-VL, a base doméstica está a progredir
Ver originalResponder0
  • Fixado