Andrej Karpathy partilhou recentemente as suas opiniões mais recentes sobre Agentes, apontando diretamente um dos maiores erros na área atual de IA: as pessoas estão a forçar os Agentes a trabalhar, ignorando completamente que primeiro devem dominar completamente o modelo de base. AK disse uma conclusão contraintuitiva: atualmente, quem está na vanguarda dos Agentes não são as grandes empresas, mas sim programadores independentes e empreendedores. Deixo o vídeo em anexo no final.

Já em 2016, a OpenAI caiu nesta armadilha e pagou o preço durante cinco anos inteiros.

A lógica central que Karpathy quer transmitir: primeiro, parar imediatamente com a fantasia de que os agentes fazem tudo, e perceber primeiro os modelos de base. Segundo, reconhecer a realidade da indústria: fazer demonstrações é extremamente fácil, mas criar um produto leva dez anos. A condução autónoma já confirmou isto: se saltar a fase da fundação, tudo o que for construído desmorona-se instantaneamente. Terceiro, perceber que o agente em si não é um produto; o verdadeiro núcleo é o modelo de base. Desde que se construa bem a base, os agentes surgirão naturalmente.

Recordando a experiência na OpenAI em 2016, Karpathy, Tim Shi e Jim Fan participaram num projeto chamado World of Bits. A intenção original era fazer com que os agentes de aprendizagem por reforço deixassem de jogar jogos como o Montezuma's Revenge e passassem a usar computador, teclado e rato.

Esperavam que os agentes executassem tarefas diárias realmente úteis, como reservar bilhetes de avião ou pedir comida num site extremamente simples. Na altura, faziam a IA clicar freneticamente no rato e no teclado, tentando à sorte entrar num mundo inteligente mais avançado. O resultado foi óbvio: o projeto falhou completamente.

A tecnologia da altura não tinha condições; a única ferramenta que a equipa tinha era a aprendizagem por reforço. A abordagem mais correta naquele momento teria sido esquecer completamente os agentes de IA e concentrar todos os esforços em construir modelos de linguagem.

Cinco anos depois, após uma breve incursão na condução autónoma, Karpathy descobriu que os agentes de IA voltaram a ser o tema quente absoluto da indústria, mas toda a cadeia de ferramentas mudou radicalmente. Hoje, as formas como as pessoas resolvem estes problemas foram completamente reconstruídas; quem desenvolve agentes provavelmente nem precisa de usar qualquer técnica de aprendizagem por reforço. Esta evulação ultrapassou todas as expectativas da altura.

Agora, toda a gente está a adorar os agentes, porque é fácil associar que a Inteligência Artificial Geral acabará por se apresentar sob a forma de algum tipo de agente de IA. No futuro, provavelmente haverá enxames de agentes, formando até grandes organizações ou civilizações de entidades digitais. Isto soa realmente empolgante.

Face a este entusiasmo, Karpathy escolhe deitar um balde de água fria. Há uma grande classe de problemas que é fácil imaginar e fácil de fazer demonstrações fixes, mas torna-se extremamente difícil transformá-los em produtos reais.

A condução autónoma é um exemplo extremamente típico. Imaginar um carro a circular sozinho à volta do quarteirão e fazer uma demonstração é fácil; torná-lo num produto que funcione na realidade leva dez anos. O mesmo se aplica à área da RV. Os agentes encaixam perfeitamente nesta característica: imaginar e fazer demonstrações é simples, mas para realmente os fazer funcionar, os programadores têm de se preparar para uma década de trabalho árduo.

Para encontrar novas ideias, Karpathy sugere que voltemos a inspirar-nos na neurociência. Foi assim que a aprendizagem profunda começou; agora, ao desenvolver agentes, podemos mais uma vez recorrer ao modo de funcionamento do cérebro.

Uma entidade digital completa precisa de ter todas as ferramentas cognitivas que os humanos possuem. Além do modelo de linguagem como parte da solução, é necessário um assistente interno para planear e refletir sobre as ações com antecedência.

A estrutura do cérebro oferece um modelo de referência perfeito. O equivalente do hipocampo num agente de IA é registar traços de memória, usando incorporação de vetores para indexação e recuperação. Sabemos mais ou menos como construir o córtex visual e auditivo de uma entidade digital; o papel do tálamo também merece reflexão. O tálamo é responsável por integrar toda a informação, sendo como a sede da consciência. Quando múltiplas entidades digitais competem pelo controlo e pelo microfone para decidir os próximos passos, o tálamo trata desses conflitos complexos. Karpathy recomendou ainda o livro "The Brain and Behavior", de David Eagleman, considerando que a neurociência contém excelentes inspirações para projetar indivíduos digitais.

Por fim, Karpathy partilhou uma realidade da indústria extremamente disruptiva.

Atualmente, quem está na vanguarda das capacidades dos agentes de IA são, sem dúvida, os programadores independentes e empreendedores que estão agora a construir agentes. Laboratórios de grandes modelos de linguagem como a OpenAI ou a DeepMind não estão atualmente na vanguarda no que toca a agentes.

A OpenAI é extremamente boa a treinar grandes modelos de linguagem Transformer. Se sair agora um artigo a propor um novo método de treino de Transformers, é provável que a OpenAI já o tenha tentado há dois anos e meio e saiba exatamente a razão do sucesso ou fracasso. As grandes empresas têm uma barreira técnica absoluta nesta área.

Quando sai um artigo sobre um novo tipo de agente, a situação é completamente diferente. As equipas das grandes empresas também ficam impressionadas, porque não estiveram a investigar secretamente neste ramo durante cinco anos. Isto significa que os gigantes têm de competir de igual para igual com todos os programadores de base e hackers nesta área.

Para os programadores comuns que estão agora a desenvolver agentes, vocês estão na vanguarda desta tecnologia transformadora.

Fonte do artigo: AI Cambriano

Aviso de risco e isenção de responsabilidade

        O mercado tem riscos, invista com cautela. Este artigo não constitui aconselhamento de investimento pessoal e não considera os objetivos de investimento, situação financeira ou necessidades específicas de cada utilizador. Os utilizadores devem considerar se as opiniões, pontos de vista ou conclusões neste artigo se adequam à sua situação específica. Qualquer investimento com base neste artigo é da responsabilidade do próprio.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
gStocksTokenizedStocksLive
4,82M Popularidade
#
StrongNonfarmPayrollsRekindleRateHikeFear
1,07M Popularidade
#
IsraelStrikesIranBTCPlunges
68,86K Popularidade
#
PredictWorldCupShare20000U
239,94K Popularidade
#
ETHBreaks1700
152,64M Popularidade

Fixado

A opinião mais recente de Karpathy sobre Agentes: as grandes empresas não dominam as tecnologias principais dos agentes inteligentes, e os desenvolvedores individuais estão a dominar a vanguarda.

Tópicos em destaque

gStocksTokenizedStocksLive

StrongNonfarmPayrollsRekindleRateHikeFear

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

ETHBreaks1700

Fixado