Código puro enfrentando redes neurais de frente! Grandes modelos de controle manual invadindo a indústria hardcore, estratégia completa executada por 14 dólares

robot
Geração do resumo em andamento
AIMPACT mensagem, 19 de maio (UTC+8), de acordo com o monitoramento do Beating da Dongcha, o membro principal do treinamento posterior da OpenAI, Weng Jiayi, acabou de provar que "apenas com grandes modelos escrevendo código é possível passar em jogos de Atari", o pesquisador Paul Garnier então aplicou esse método ao controle de dinâmica de fluidos mais avançado. Ele não treinou nenhuma rede neural durante todo o processo. Simplesmente deixou o Codex 5.5 atuar como programador, assistindo às gravações de simulação de fluidos e reescrevendo scripts Python repetidamente. Com essas regras de controle feitas à mão, a IA conseguiu superar a maioria dos cenários em mais de dez testes físicos, derrotando a linha de base de aprendizado por reforço (DRL) de ponta. Para reduzir a resistência do carro e acalmar a turbulência nos tubos, a indústria anteriormente só podia depender de poder computacional massivo, alimentando um modelo de caixa preta incompreensível para controlar as válvulas de fluxo de ar. O Codex evitou esse beco sem saída. As regras que ele gerou são extremamente diretas, como "quando a curvatura local for muito grande, adiar o jato". Decisões curtas com conhecimento físico, substituindo a tentativa e erro cega de redes neurais. Trocar a caixa preta por código eliminou a vulnerabilidade da rede neural, que é rígida e quebra ao menor impacto. Antes, qualquer pequena mudança de hardware (como trocar de 5 para 10 bicos de controle) fazia o modelo antigo ser descartado imediatamente, exigindo novo treinamento dispendioso. Agora, basta alterar uma constante no código para que o sistema se adapte instantaneamente a novos dispositivos. Quando o tempo de teste foi forçadamente estendido por quatro vezes, os modelos tradicionais de DRL, que dependem da experiência, colapsaram completamente; mas o código escrito por grandes modelos, que segue diretamente a lógica física, permaneceu estável. Para implementar toda essa estratégia de controle, o grande modelo consumiu apenas 21,25 milhões de tokens, com um custo total inferior a 14 dólares. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado