Sócios do YC: Em vez de competir pelo tamanho do modelo, deixe a IA evoluir por si mesma escrevendo código como um cientista

robot
Geração de resumo em curso
De acordo com o monitoramento Beating, a parceira do Y Combinator Diana Hu apontou no X que, em vez de simplesmente ampliar a escala dos parâmetros, o futuro está na construção de uma camada de software fina sobre o modelo base, permitindo que a IA escreva regras para resolver problemas como um programador (modelo de mundo executável). A IA pode testar, modificar e simplificar o código continuamente com base nos resultados, sem a necessidade de ajustar finamente o grande modelo, que é dispendioso.

O caminho do aprendizado de código sem gradiente confirma o paradigma de aprendizado heurístico (Heuristic Learning) proposto pelo membro principal do treinamento da OpenAI,翁家翌, no mês passado. Para ensinar uma tarefa à IA, o aprendizado por reforço tradicional exige milhares de ajustes, forçando a experiência a ser inserida na caixa preta da rede neural, consumindo muita energia e sendo facilmente esquecida. Já os experimentos de翁家翌 mostram que, sem ajustar qualquer parâmetro do grande modelo, a IA consegue escrever código Python, encontrar bugs e ajustar regras sozinha, conquistando jogos como Breakout no Atari. Isso indica que o portador do conhecimento pode ser um sistema de código legível e testável por humanos, e não apenas pesos de redes neurais incompreensíveis.

Na visão de Paul Graham, cofundador do YC, o ciclo de escrever código, validar e comprimir é muito próximo da rotina de um cientista. O grande modelo não precisa reestruturar o cérebro, mas, como um cientista, usar código para formular hipóteses sobre um novo ambiente, executar o código para validar as hipóteses e extrair regras mais simples para resolver problemas. O processo de buscar o programa mais simples também é o padrão final para medir a eficiência da inteligência artificial, conhecido como ARC-AGI.

O benefício mais importante é que o aprendizado sem gradiente pode aproveitar a capacidade aprimorada do modelo base. Quanto mais inteligente o modelo base ficar, mais forte será o código e as estratégias criadas pela IA. Com base na dolorosa lição de Richard Sutton (The Bitter Lesson), o aprendizado de código sem gradiente está traçando uma nova curva em forma de S. Com a explosão na capacidade de código do grande modelo, o caminho de autoevolução da IA está abrindo o palco para a próxima geração de paradigmas de inteligência artificial.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado