De acordo com o monitoramento Beating, a parceira do Y Combinator Diana Hu apontou no X que, em vez de simplesmente ampliar a escala dos parâmetros, o futuro está na construção de uma camada de software fina sobre o modelo base, permitindo que a IA escreva regras para resolver problemas como um programador (modelo de mundo executável). A IA pode testar, modificar e simplificar o código continuamente com base nos resultados, sem a necessidade de ajustar finamente o grande modelo, que é dispendioso.

O caminho do aprendizado de código sem gradiente confirma o paradigma de aprendizado heurístico (Heuristic Learning) proposto pelo membro principal do treinamento da OpenAI,翁家翌, no mês passado. Para ensinar uma tarefa à IA, o aprendizado por reforço tradicional exige milhares de ajustes, forçando a experiência a ser inserida na caixa preta da rede neural, consumindo muita energia e sendo facilmente esquecida. Já os experimentos de翁家翌 mostram que, sem ajustar qualquer parâmetro do grande modelo, a IA consegue escrever código Python, encontrar bugs e ajustar regras sozinha, conquistando jogos como Breakout no Atari. Isso indica que o portador do conhecimento pode ser um sistema de código legível e testável por humanos, e não apenas pesos de redes neurais incompreensíveis.

Na visão de Paul Graham, cofundador do YC, o ciclo de escrever código, validar e comprimir é muito próximo da rotina de um cientista. O grande modelo não precisa reestruturar o cérebro, mas, como um cientista, usar código para formular hipóteses sobre um novo ambiente, executar o código para validar as hipóteses e extrair regras mais simples para resolver problemas. O processo de buscar o programa mais simples também é o padrão final para medir a eficiência da inteligência artificial, conhecido como ARC-AGI.

O benefício mais importante é que o aprendizado sem gradiente pode aproveitar a capacidade aprimorada do modelo base. Quanto mais inteligente o modelo base ficar, mais forte será o código e as estratégias criadas pela IA. Com base na dolorosa lição de Richard Sutton (The Bitter Lesson), o aprendizado de código sem gradiente está traçando uma nova curva em forma de S. Com a explosão na capacidade de código do grande modelo, o caminho de autoevolução da IA está abrindo o palco para a próxima geração de paradigmas de inteligência artificial.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
ShareYourUSStocksWinNvidia
3.69M Popularidade
#
BitcoinRalliesOver5Percent
499.07M Popularidade
#
IsraelStrikesIranBTCPlunges
56.29K Popularidade
#
WinGoldBarsWithGrowthPoints
1.35M Popularidade
#
StrongNonfarmPayrollsRekindleRateHikeFear
1.81M Popularidade

Fixado

Sócios do YC: Em vez de competir pelo tamanho do modelo, deixe a IA evoluir por si mesma escrevendo código como um cientista

Tópicos em destaque

ShareYourUSStocksWinNvidia

BitcoinRalliesOver5Percent

IsraelStrikesIranBTCPlunges

WinGoldBarsWithGrowthPoints

StrongNonfarmPayrollsRekindleRateHikeFear

Fixado