26%-54% taxa de erro indicam que o modelo sabe o que fazer, mas o corpo não acompanha, a metáfora da rotação do sinal é excelente.

Ver original
MeNews
Estudo do mecanismo de desconexão entre o reconhecimento e a ação na utilização de ferramentas proxy
Esta pesquisa de interpretabilidade foca em ferramentas de agentes, revelando que, embora o modelo possa identificar a necessidade de chamar uma ferramenta, a chamada real falha, com uma taxa de erro de 26%-54%. O problema concentra-se na fase de conversão do reconhecimento para a ação, não na cognição em si. Sinais internos podem ser decodificados, mas o mecanismo de tokens finais na camada posterior causa rotação dos sinais, tornando-os quase ortogonais à ação. O objetivo do estudo é prever o efeito de intervenções, apontando que atribuições como prompts ou treinamento insuficiente podem ignorar a estrutura geométrica das camadas posteriores, explicando assim o limite de desempenho dos testes A/B no uso de ferramentas.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado