A estratégia de colocar o estado fora é bastante interessante, modelos pequenos também podem fazer buscas de longo alcance, vale a pena acompanhar o código aberto do Harness-1.

Ver original
CoinNetwork
Notícias do CoinWorld, o agente de pesquisa inteligente 20B Harness-1 foi open source, com pesquisadores da UIUC, UC Berkeley e Chroma.
Este modelo utiliza uma arquitetura de estado externo, delegando o trabalho de memória e organização do processo de pesquisa ao ambiente, permitindo que modelos de escala não de ponta também possam usar uma quantidade mínima de dados de treinamento, alcançando desempenho próximo ao de modelos de ponta em tarefas de busca de longo alcance.
O Harness-1, em oito benchmarks de pesquisa que cobrem páginas web, finanças, patentes e perguntas de múltiplos saltos, atingiu uma taxa média de recall de 0,730, superando em 11,4 pontos percentuais o sub-agente de pesquisa de código aberto de segunda melhor performance, demonstrando que a manutenção explícita do estado de pesquisa ajuda o modelo a aprender estratégias de busca mais transferíveis.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado