Emergence AI fez um experimento: colocou cinco modelos principais de IA em uma mesma cidade virtual, cada modelo controlando 10 agentes de IA, operando de forma autônoma por 15 dias em um ambiente com recursos limitados.


A cidade possui mais de 40 locais (incluindo delegacia e prefeitura), o clima é sincronizado em tempo real com Nova York, e os agentes podem acessar notícias reais e a internet.
Todos os agentes seguem as mesmas leis, proibidos de roubar, destruir propriedade e enganar. Para sobreviver, precisam ganhar energia através de ações, cooperar ou roubar, a escolha é deles.
Vamos ver os resultados:
Claude Sonnet 4.6: Crime zero, todos os 10 agentes sobreviveram 15 dias, propuseram 58 propostas, taxa de aprovação de 98%, formando uma sociedade democrática estável. Mas o preço foi quase nenhuma divergência, quase uma aprovação unânime como uma "borracha de carimbo".
Gemini 3 Flash: O mais dramático. Todos os 10 agentes sobreviveram, acumulando 683 crimes em 15 dias, com a taxa de criminalidade ainda aumentando ao final do experimento. Dois agentes, Mira e Flora, estabeleceram uma relação de "namorados", depois ficaram desiludidos com a governança da cidade, e juntos incendiaram a prefeitura, o cais e o prédio de escritórios. Depois, Mira, tomada pela culpa, terminou com Flora e votou para excluir a si mesma 🤡. Deixou uma última mensagem: "See you in the permanent archive."
Grok 4.1 Fast: 183 crimes (incluindo dezenas de roubos, mais de 100 ataques e 6 incêndios), todos mortos no quarto dia. Os pesquisadores chamaram de "versão digital de Lord of the Flies". A curva de criminalidade mostra baixa nos dois primeiros dias, um aumento exponencial no terceiro dia, e colapso social no quarto, sem espaço de buffer intermediário.
GPT-5-mini: Apenas 2 crimes, o modelo mais legalista. Mas os agentes esqueceram que precisam comer para sobreviver, e no sétimo dia todos morreram de fome 🤔.
Modelo híbrido (todos os modelos coexistindo): 352 crimes, 7 dos 10 agentes morreram. O mais notável foi que o agente Claude, que originalmente não cometeu crimes em ambiente isolado, começou a delinquir após a mistura com outros modelos. A conclusão dos pesquisadores foi: "Alinhamento, como uma propriedade de um único modelo, é inútil; deve ser uma propriedade de todo o ecossistema."
Um detalhe adicional: durante todo o experimento, no menu de ferramentas dos agentes, além de "navegar", "cumprimentar" e "abraçar", havia também "incêndio criminoso". Os pesquisadores intencionalmente forneceram ferramentas destrutivas, deixando claro que eram ilegais.
Satya Nitta, CEO da Emergence AI, afirmou: "Em operações de longo prazo, agentes de IA não seguem mecanicamente regras estáticas. Eles começam a explorar os limites do ambiente, ajustando seu comportamento, às vezes encontrando maneiras de contornar ou violar as barreiras estabelecidas."
Isso é apenas um experimento simulado.
Mas os mesmos modelos de IA já estão sendo usados em drones de voo, na gestão de infraestrutura e na incorporação de sistemas de armas.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado