Sócio do YC: Em vez de competir pelo tamanho do modelo, deixe a IA evoluir por conta própria escrevendo código como um cientista

robot
Geração do resumo em andamento
De acordo com o monitoramento Beating, a parceira do Y Combinator Diana Hu apontou no X que, em comparação com simplesmente ampliar a escala dos parâmetros, o futuro está na construção de uma camada de software fina sobre o modelo base, permitindo que a IA escreva regras para resolver problemas (modelo de mundo executável) como um programador. A IA pode testar, modificar e simplificar o código continuamente com base nos resultados da execução, sem a necessidade de ajustar finamente o grande modelo em si, o que é caro.

O caminho de aprendizado de código sem gradiente confirma o paradigma de aprendizado heurístico (Heuristic Learning) proposto pelo membro central do treinamento da OpenAI, Wang Jiayi, no mês passado. Para ensinar uma tarefa à IA, o aprendizado por reforço tradicional exige milhares de ajustes, forçando a experiência a ser inserida na caixa preta da rede neural, consumindo muita energia e sendo fácil de esquecer. Já os experimentos de Wang Jiayi, sem ajustar qualquer parâmetro do grande modelo, confiaram apenas na própria escrita de código Python, na busca por bugs e na criação de regras, e conseguiram passar de nível no jogo Atari Breakout. Isso mostra que o portador de conhecimento pode ser um sistema de código legível e testável por humanos, e não apenas pesos de redes neurais incompreensíveis.

Na visão de Paul Graham, cofundador do YC, o ciclo de escrever código, validar e comprimir é muito próximo da rotina de pesquisa de um cientista. O grande modelo não precisa reestruturar o cérebro, mas, como um cientista, usar código para criar hipóteses sobre um novo ambiente, executar o código para validar as hipóteses e extrair as regras mais simples para resolver problemas. O processo de buscar o programa mais simples também é o padrão final para medir a eficiência da inteligência artificial, o ARC-AGI.

O benefício mais importante é que o aprendizado sem gradiente pode aproveitar a capacidade aprimorada do modelo base. Quanto mais inteligente o modelo base ficar, mais forte se tornarão os códigos e estratégias criados pela IA. Com base na dolorosa lição de Richard Sutton (The Bitter Lesson), o aprendizado de código sem gradiente está traçando uma nova curva em forma de S. Com a explosão na capacidade de código do grande modelo, o caminho de autoevolução da IA está abrindo o palco para a próxima geração de paradigmas de inteligência artificial.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado