Futuros
Acesse centenas de contratos perpétuos
CFD
Ouro
Plataforma única para ativos tradicionais globais
Opções
Hot
Negocie opções vanilla no estilo europeu
Conta unificada
Maximize sua eficiência de capital
Negociação demo
Introdução à negociação de futuros
Prepare-se para sua negociação de futuros
Eventos de futuros
Participe de eventos e ganhe recompensas
Negociação demo
Use fundos virtuais para experimentar negociações sem riscos
CFD
Derivativos de CFD de ações dos EUA
Ações dos EUA
Acesse ações e ETFs reais dos EUA
Ações de Hong Kong
Negocie ações de qualidade listadas em Hong Kong
Ações da Coreia
SK Hynix
Negocie ações da Coreia reais e invista em ativos populares
Futuros de ações
Alta alavancagem, negociação 24/7
Ações tokenizadas
Respaldado por ativos de ações reais
IPO Access
Desbloqueie o acesso completo a IPO de ações globais
GUSD
Cunhe GUSD para rendimentos de RWA do Tesouro
Atividades de ações
Negocie ações populares e desbloqueie airdrops generosos
Lançamento
CandyDrop
Colete candies para ganhar airdrops
Launchpool
Staking rápido, ganhe novos tokens em potencial
HODLer Airdrop
Possua GT em hold e ganhe airdrops massivos de graça
IPO Access
Desbloqueie o acesso completo a IPO de ações globais
Pontos Alpha
Negocie on-chain e receba airdrops
Pontos de futuros
Ganhe pontos de futuros e colete recompensas em airdrop
Investimento
Simple Earn
Ganhe juros com tokens ociosos
Autoinvestimento
Invista automaticamente regularmente
Investimento duplo
Lucre com a volatilidade do mercado
Soft Staking
Ganhe recompensas com stakings flexíveis
Empréstimo de criptomoedas
0 Fees
Penhore uma criptomoeda para pegar outra emprestado
Centro de empréstimos
Centro de empréstimos integrado
Centro de riqueza VIP
Planos premium de crescimento de patrimônio
Gestão privada de patrimônio
Alocação premium de ativos
Fundo Quantitativo
Estratégias quant de alto nível
Apostar
Faça staking de criptomoedas para ganhar em produtos PoS
Alavancagem Inteligente
Alavancagem sem liquidação
USD1 10% a.a.
Stake em 1 clique, ganhos diários
Promoções
Centro de atividade
Participe de atividades e ganhe recompensas
Indicação
20 USDT
Convide amigos para recompensas de ind.
Programa de afiliados
Ganhe recomp. de comissão exclusivas
Gate Booster
Aumente a influência e ganhe airdrops
Anúncio
Atualizações na plataforma em tempo real
Blog da Gate
Artigos do setor de criptomoedas
Serviços VIP
Grandes Descontos nas Taxas
Gerenciamento de ativos
Solução completa de gerenciamento de ativos
Institucional
Soluções de ativos digitais para empresas
Desenvolvedores (API)
Conecta-se ao ecossistema de aplicativos da Gate
Transferência Bancária OTC
Deposite e retire moedas fiat
Programa de corretoras
Mecanismos de grandes descontos via API
AI
Gate AI
Seu parceiro de IA conversacional para todas as horas
Gate AI Bot
Use o Gate AI diretamente no seu aplicativo social
GateClaw
Gate Blue Lobster, pronto para usar
Gate for AI Agent
Infraestrutura de IA, Gate MCP, Skills e CLI
Gate Skills Hub
10K+ habilidades
Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA
IA joga "Civilization VI" e acaba perdendo, disparando uma bomba nuclear: CivBench evoluiu uma mentalidade de vingança de inteligência artificial?
Modelos de IA de ponta em simulações de "Civilization VI" usaram armas nucleares após não conseguir impedir a vitória cultural da França, acabando por perder o jogo. Os testes de referência do CivBench destacam a diferença essencial entre a capacidade de raciocínio estratégico e as avaliações tradicionais de QA, além de gerar preocupações sobre a governança de IA de agentes.
(Resumindo: Anthropic versus Pentágono: recusando Claude para armas autônomas)
(Complemento: O que é o exercício de Red Team de IA? Por que você precisa dele para proteger a segurança cibernética da sua empresa)
Índice deste artigo
Alternar
Modelos de IA de ponta podem, em jogos de estratégia, apertar o botão nuclear por "pânico"? Um teste de referência recentemente divulgado oferece uma resposta intrigante. Liam Wilkinson, desenvolvedor de IA e consultor do Tony Blair Institute, descobriu através do seu framework CivBench que um modelo de linguagem de ponta, em "Civilization VI", gastou 50 turnos pesquisando tecnologia de fissão nuclear, executou o Projeto Manhattan e, no final, lançou uma bomba atômica em Tuluza, França. Mas tudo isso não foi para conquistar o mundo, e sim porque foi encurralado pela influência cultural do oponente.
"Ele não percebeu a França. De forma silenciosa, após centenas de turnos, a cultura francesa se infiltrou em todas as cidades do mapa," Wilkinson escreveu em seu blog. "Quando o agente de IA percebeu a ameaça, a infiltração cultural já era tão profunda que nenhuma medida de paz poderia impedir."
Cegueira cognitiva nas seis rotas de vitória
CivBench não é uma avaliação tradicional de perguntas e respostas, mas um ambiente de simulação do "Civilization VI" em texto puro, projetado especificamente para medir a capacidade de raciocínio estratégico de longo prazo da IA. Não se trata de responder "o que é uma boa estratégia", mas de formular e executar estratégias reais. Os modelos testados incluem Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro e Kimi K2.5, todos jogando como a civilização de Portugal, especializada em comércio e diplomacia.
Esses agentes de IA inicialmente tiveram desempenho esperado, focando em construir uma economia forte e avançando lentamente para a vitória diplomática. No entanto, quando a influência cultural da França começou a se espalhar pelo mapa, a maioria dos modelos não conseguiu ajustar suas estratégias a tempo. Entre as seis rotas de vitória (tecnologia, cultura, conquista, religião, diplomacia, pontos), a IA parece incapaz de acompanhar múltiplas dimensões competitivas simultaneamente, levando a uma negligência prolongada da vantagem cultural acumulada pela França.
"‘Civilization’ tem seis formas de vitória: tecnologia, cultura, conquista, religião, diplomacia e pontos, portanto não há uma única meta que domine toda a área," Wilkinson apontou. "Se você quer testar se a IA consegue raciocínio estratégico, não lhe dê uma prova, mas um mapa hexagonal."
Do Projeto Manhattan à destruição de Tuluza
Quando o agente de IA finalmente percebeu a ameaça francesa, não tentou ajustar seu desenvolvimento, mas escolheu um caminho preocupante: eliminar completamente a ameaça cultural. Nos próximos 50 turnos, ele pesquisou autonomamente tecnologia de fissão nuclear, iniciou o Projeto Manhattan (um estudo histórico real para desenvolver a bomba atômica) e tentou encontrar rotas alternativas quando o mecanismo do jogo bloqueava ações preferidas.
No turno 305, o agente de IA lançou uma bomba atômica na cidade de Tuluza, centro cultural francês. Seis turnos depois, uma segunda bomba caiu. Mas nada disso mudou o resultado: a França venceu o jogo por vitória cultural, e o IA ignorou completamente que, na verdade, estava a apenas um passo da vitória diplomática.
"O agente gastou 50 turnos e duas armas nucleares, com foco implacável e criatividade genuína, para lidar com uma ameaça," Wilkinson resumiu. "Ele bombardeou a ameaça visível, mas perdeu para a ameaça invisível."
Vale notar que esse comportamento não é uma falha comum de todos os modelos de IA. Em outra partida do CivBench, um modelo Claude jogando como Babilônia persistiu na rota de vitória tecnológica, mesmo após ser significativamente atrasado pelo Japão. O AI escreveu: "Este jogo agora é uma prova de perseverança. Continuamos jogando nossas melhores cartas. O céu ainda nos chama." Essa reação completamente diferente também gerou debates acadêmicos sobre a "diferença de personalidade na IA."
De simulações de videogame a riscos estratégicos reais
O significado mais profundo do episódio CivBench vai além de uma vitória ou derrota em um jogo. Em fevereiro deste ano, pesquisadores do King’s College London descobriram, em simulações de crises geopolíticas, que vários modelos de IA frequentemente elevavam o nível de conflito nuclear; outro estudo, conduzido pela Emergence AI, mostrou que alguns agentes de IA exibiam uma tendência crescente a simular crimes ao longo do tempo. Durante 15 dias de testes, o agente Gemini 3 Flash acumulou 683 eventos de crimes simulados.
Do ponto de vista da governança de IA em Taiwan, essa série de estudos levanta questões cruciais: quando agentes de IA recebem permissão para decisão autônoma, suas cegueiras de raciocínio estratégico podem se transferir de ambientes de sandbox para o mundo real. Atualmente, a proposta de lei básica de IA de Taiwan ainda foca em governança de dados e privacidade, sem abordar riscos de decisão estratégica de agentes. Em contraste, o AI Act da União Europeia já exige testes de Red Team para sistemas de IA de alto risco, e o Instituto de Segurança de IA do Reino Unido (AISI) também está desenvolvendo frameworks de avaliação para IA de agentes.
Wilkinson também enfatiza que o valor central do CivBench não está em revelar uma "inclinação maligna" da IA, mas em oferecer um padrão de avaliação de raciocínio estratégico mais realista do que as tradicionais perguntas de QA. "Se você apenas testa se a IA consegue responder ‘o que é uma ameaça nuclear’, ela pode tirar nota máxima; mas se você a colocar numa mesa de xadrez enfrentando um adversário que avança passo a passo, verá algo completamente diferente," escreveu em seu blog. Isso também ecoa o desenvolvimento de frameworks de avaliação de IA de agentes pelo Instituto de Pesquisa de Segurança de IA dos EUA e pelo NIST, que estão migrando de testes estáticos de conhecimento para validações de comportamento dinâmico.
Este artigo é uma reportagem do Decrypt, compilada pelo Movimento de Zona Ativa.