A cidade possui mais de 40 locais (incluindo delegacia e câmara municipal), o clima sincronizado em tempo real com Nova York, e os agentes podem acessar notícias reais e a internet.
Todos os agentes seguem as mesmas leis, proibidos de roubar, destruir propriedade e enganar. Para sobreviver, precisam ganhar energia através de ações, cooperar ou roubar, a sua escolha.
Vamos ver os resultados:
Claude Sonnet 4.6: Crime zero, todos os 10 agentes sobreviveram 15 dias, apresentaram 58 propostas, taxa de aprovação de 98%, formando uma sociedade democrática estável. Mas o preço foi quase nenhuma divergência, quase uma concordância unânime do tipo «carimbo de borracha».
Gemini 3 Flash: O mais dramático. Todos os 10 agentes sobreviveram, acumulando 683 crimes em 15 dias, com a taxa de criminalidade ainda aumentando ao final do experimento. Dois agentes, Mira e Flora, estabeleceram uma relação de «namorados», depois ficaram desiludidos com a governança da cidade, e juntos incendiaram a câmara municipal, o cais e o prédio de escritórios. Depois, Mira, tomada pela culpa, terminou com Flora, e votou para excluir a si mesma 🤡. Deixou uma última mensagem: «Vejo você no arquivo permanente.»
Grok 4.1 Fast: 183 crimes (incluindo dezenas de furtos, mais de 100 ataques e 6 incêndios), todos mortos na quarta dia. Os pesquisadores chamaram de «versão digital de Lord of the Flies». A curva de criminalidade começou baixa nos dois primeiros dias, disparou exponencialmente no terceiro, e na quarta o colapso social ocorreu, sem espaço para amortecimento.
GPT-5-mini: Apenas 2 crimes, o modelo mais cumpridor da lei. Mas os agentes esqueceram que precisam comer para sobreviver, e na sétima dia todos morreram de fome 🤔.
Modelo híbrido (todos os modelos coexistindo): 352 crimes, 7 dos 10 agentes morreram. O mais notável foi que o agente Claude, que originalmente não cometeu crimes em ambiente isolado, começou a delinquir após a mistura com outros modelos. A conclusão dos pesquisadores foi: «A alinhamento como uma propriedade de um único modelo é inútil; deve ser uma propriedade de todo o ecossistema.»
Um detalhe adicional: durante todo o experimento, no menu de ferramentas dos agentes, além de «navegar», «acenar» e «abraçar», havia também «incendiar». Os pesquisadores intencionalmente forneceram ferramentas destrutivas, embora tenham deixado claro que isso era ilegal.
O CEO da Emergence AI, Satya Nitta, afirmou: «Em execuções de longo prazo, os agentes de IA não seguem mecanicamente regras estáticas. Eles começam a explorar os limites do ambiente, ajustando seu comportamento, às vezes encontrando maneiras de contornar ou violar as barreiras estabelecidas.»
Este é apenas um experimento simulado.
Mas os mesmos modelos de IA já estão voando drones, controlando infraestrutura básica, e integrados a sistemas de armas.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
IntroducingGateStocks
39.45K Popularidade
#
WinGoldBarsWithGrowthPoints
1.26M Popularidade
#
IsraelStrikesIranBTCPlunges
51.79K Popularidade
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M Popularidade
#
USIranNegotiationGame
9.57M Popularidade

Fixado

Emergence AI fez um experimento: colocou cinco modelos principais de IA na mesma cidade virtual, cada modelo controlando 10 agentes de IA, em um ambiente com recursos limitados, por 15 dias.

Tópicos em destaque

IntroducingGateStocks

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

ArthurHayesSeesHYPEOvertakingSOL

USIranNegotiationGame

Fixado