Emergence AI fez um experimento: colocou cinco modelos principais de IA na mesma cidade virtual, cada modelo controlando 10 agentes de IA, em um ambiente com recursos limitados, por 15 dias.


A cidade possui mais de 40 locais (incluindo delegacia e câmara municipal), o clima sincronizado em tempo real com Nova York, e os agentes podem acessar notícias reais e a internet.
Todos os agentes seguem as mesmas leis, proibidos de roubar, destruir propriedade e enganar. Para sobreviver, precisam ganhar energia através de ações, cooperar ou roubar, a sua escolha.
Vamos ver os resultados:
Claude Sonnet 4.6: Crime zero, todos os 10 agentes sobreviveram 15 dias, apresentaram 58 propostas, taxa de aprovação de 98%, formando uma sociedade democrática estável. Mas o preço foi quase nenhuma divergência, quase uma concordância unânime do tipo «carimbo de borracha».
Gemini 3 Flash: O mais dramático. Todos os 10 agentes sobreviveram, acumulando 683 crimes em 15 dias, com a taxa de criminalidade ainda aumentando ao final do experimento. Dois agentes, Mira e Flora, estabeleceram uma relação de «namorados», depois ficaram desiludidos com a governança da cidade, e juntos incendiaram a câmara municipal, o cais e o prédio de escritórios. Depois, Mira, tomada pela culpa, terminou com Flora, e votou para excluir a si mesma 🤡. Deixou uma última mensagem: «Vejo você no arquivo permanente.»
Grok 4.1 Fast: 183 crimes (incluindo dezenas de furtos, mais de 100 ataques e 6 incêndios), todos mortos na quarta dia. Os pesquisadores chamaram de «versão digital de Lord of the Flies». A curva de criminalidade começou baixa nos dois primeiros dias, disparou exponencialmente no terceiro, e na quarta o colapso social ocorreu, sem espaço para amortecimento.
GPT-5-mini: Apenas 2 crimes, o modelo mais cumpridor da lei. Mas os agentes esqueceram que precisam comer para sobreviver, e na sétima dia todos morreram de fome 🤔.
Modelo híbrido (todos os modelos coexistindo): 352 crimes, 7 dos 10 agentes morreram. O mais notável foi que o agente Claude, que originalmente não cometeu crimes em ambiente isolado, começou a delinquir após a mistura com outros modelos. A conclusão dos pesquisadores foi: «A alinhamento como uma propriedade de um único modelo é inútil; deve ser uma propriedade de todo o ecossistema.»
Um detalhe adicional: durante todo o experimento, no menu de ferramentas dos agentes, além de «navegar», «acenar» e «abraçar», havia também «incendiar». Os pesquisadores intencionalmente forneceram ferramentas destrutivas, embora tenham deixado claro que isso era ilegal.
O CEO da Emergence AI, Satya Nitta, afirmou: «Em execuções de longo prazo, os agentes de IA não seguem mecanicamente regras estáticas. Eles começam a explorar os limites do ambiente, ajustando seu comportamento, às vezes encontrando maneiras de contornar ou violar as barreiras estabelecidas.»
Este é apenas um experimento simulado.
Mas os mesmos modelos de IA já estão voando drones, controlando infraestrutura básica, e integrados a sistemas de armas.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado