Ambiente de agente inteligente de código aberto Prime Intellect que pode evoluir por si próprio: permite que a IA "luta consigo mesma" gerando mais de 8000 ferramentas de teste

AIMPACT mensagem, 19 de maio (UTC+8), de acordo com o monitoramento do Beating do Dongcha, a Prime Intellect anunciou o ambiente de treinamento de agentes de inteligência de código aberto general-agent, um ambiente totalmente sintético que pode evoluir por si próprio. O foco do lançamento foi transformar a geração de tarefas em um jogo de dois jogadores: um sintetizador e um solucionador se enfrentando alternadamente, atualmente construindo automaticamente um grande banco de dados de estado contendo 4504 tarefas e mais de 8000 ferramentas únicas. Este framework começa com tarefas simples de sementes, dividindo as tarefas em cinco níveis de dificuldade de t0 a t4 através de nove estratégias, incluindo restrições condicionais, comandos com ruído, acoplamento entre entidades, entre outros. O sintetizador é responsável por projetar tarefas com banco de dados, ferramentas de interação e funções de validação, enquanto o solucionador tenta completar as tarefas. Somente tarefas com taxa de sucesso dentro de uma faixa de dificuldade específica serão preservadas, e o nível mais difícil será usado como semente para a próxima rodada de evolução. Testes oficiais mostraram que, apenas com esse ambiente, mais de 4400 trajetórias geradas por síntese foram usadas para ajustar um modelo de 30 bilhões de parâmetros, elevando a precisão na chamada de ferramentas no teste de referência BFCL de 18,9% para 52,3%. Esse mecanismo permite que o modelo se liberte da dependência de conjuntos de dados estáticos anotados manualmente. Através de jogos diretos entre modelos, o sistema consegue gerar continuamente dados de treinamento com dificuldade controlada e validação semântica de forma automática. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado