Grande parte da discussão inicial da revolução generativa da IA em jogos se concentrou em como as ferramentas de IA poderiam aumentar a eficiência dos criadores de jogos, permitindo que os jogos fossem produzidos mais rapidamente e em maior escala do que antes. A longo prazo, acreditamos que a IA não apenas mudará a maneira como os jogos são criados, mas também a própria natureza dos jogos.
O tempo todo, a IA está ajudando a gerar novas formas de jogos. De masmorras geradas processualmente em Rogue (1980), a máquinas de estado finito em Half-Life (1998), a diretores de jogos de IA em Left 4 Dead (2008). Mais recentemente, os avanços na tecnologia de aprendizado profundo mudaram ainda mais o jogo, permitindo que os computadores gerem novos conteúdos com base em solicitações do usuário e grandes conjuntos de dados.
Ainda é cedo, mas já estamos vendo algumas áreas interessantes de jogos orientados por IA, incluindo agentes generativos, personalização, narrativa de IA, mundos dinâmicos e co-pilotos de IA. Se forem bem-sucedidos, esses sistemas podem se combinar para criar jogos emergentes de IA que retenham jogadores leais.
Agente Gerador
Lançado pela Maxis' SimCity em 1989, o jogo de simulação permite aos jogadores construir e gerenciar uma cidade virtual. Hoje, o jogo de simulação mais popular é o The Sims, onde mais de 70 milhões de jogadores em todo o mundo gerenciam pessoas virtuais conhecidas como "sims" e as deixam cuidar de suas vidas diárias. O designer Will Wright certa vez descreveu The Sims como uma "casa de bonecas interativa".
A IA generativa pode avançar muito no desenvolvimento de jogos de simulação, tornando os agentes mais realistas por meio de comportamentos sociais emergentes conduzidos por grandes modelos de linguagem (LLMs).
No início deste ano, uma equipe de pesquisa da Universidade de Stanford e do Google publicou um artigo mostrando como aplicar o LLM a agentes em jogos. Liderada pelo estudante de doutorado Joon Sung Park, a equipe de pesquisa incorporou 25 agentes semelhantes aos Sims em um mundo de sandbox de pixel art cujo comportamento foi determinado pelo ChatGPT e uma arquitetura que estende o LLM para usar linguagem natural para armazenar um registro completo da experiência de um agente, sintetizar essas memórias em reflexão de nível superior e recuperá-las dinamicamente para planejar o comportamento.
Esses resultados são uma excelente prévia do potencial futuro dos jogos de simulação. Começando com uma sugestão especificada pelo usuário de que um agente deseja oferecer uma festa de Dia dos Namorados, os agentes distribuem convites para festas de forma independente, fazem novas amizades, convidam uns aos outros para encontros e se coordenam para chegar à festa no horário dois dias depois.
Esse comportamento é possível porque os LLMs são treinados em dados de redes sociais, de modo que seus modelos incluem os fundamentos de como os humanos conversam entre si e se comportam em vários contextos sociais. E em ambientes digitais interativos, como jogos analógicos, essas respostas podem ser acionadas para criar um comportamento realista.
Do ponto de vista do jogador, o resultado final é uma experiência de jogo mais envolvente. Grande parte da diversão de jogar The Sims ou simulador de colônia RimWorld vem do acontecimento inesperado. Com o comportamento do agente nas redes sociais, podemos ver jogos de simulação que não apenas mostram a imaginação dos designers de jogos, mas também refletem a imprevisibilidade da sociedade humana. Assistir a esses sims pode fornecer tanto entretenimento quanto assistir à próxima geração do The Truman Show de uma maneira que não é possível com a TV ou os filmes pré-produzidos de hoje.
Os próprios agentes também podem ser personalizados, baseando-se em nossas aspirações imaginativas para um jogo de "Casa de Bonecas". Os jogadores podem criar um agente ideal com base em si mesmos ou em personagens fictícios. "Ready Player Me" permite que os usuários gerem seu próprio avatar 3D tirando uma selfie e importando o avatar para mais de 9.000 jogos/aplicativos. As plataformas de personagens AI Character.ai, InWorld e Convai podem criar NPCs personalizados com suas próprias histórias de fundo, personalidades e controles comportamentais.
Com recursos de linguagem natural, a forma como interagimos com os agentes também foi expandida. Hoje, os desenvolvedores podem usar os modelos de conversão de texto em fala da Eleven Labs para gerar vozes realistas para seus agentes. A Convai recentemente fez parceria com a Nvidia para uma demonstração bem divulgada na qual os jogadores podem se envolver em uma conversa de voz natural com um NPC de chef de ramen de IA, com o diálogo e as expressões faciais combinadas geradas em tempo real. O aplicativo complementar de AI Replika já permite que os usuários conversem com seus amigos por voz, vídeo e AR/VR. No futuro, pode-se imaginar um jogo de simulação em que os jogadores possam manter contato com seus agentes por telefone ou bate-papo por vídeo durante a viagem e, em seguida, clicar em um jogo mais envolvente quando retornarem ao computador.
No entanto, ainda há muitos desafios a serem resolvidos antes que possamos ver uma versão totalmente gerada do The Sims. Os dados de treinamento para LLMs têm vieses inerentes que podem ser refletidos no comportamento do agente. Jogos de serviço em tempo real 24 horas por dia, 7 dias por semana O custo de executar simulações em grande escala pode não ser economicamente viável, executar 25 agentes em 2 dias custaria à equipe de pesquisa milhares de dólares em computação. Os esforços para descarregar as cargas de trabalho do modelo para os dispositivos são promissores, mas ainda relativamente cedo. Também podemos precisar desenvolver novas normas em torno de relacionamentos quase sociais com agentes.
Mas uma coisa é certa, há uma enorme demanda por agentes generativos no momento. Em nossa pesquisa recente, 61% dos estúdios de jogos planejam experimentar NPCs de IA. Acreditamos que os companheiros de IA logo se tornarão comuns à medida que os agentes entrarem em nossas esferas sociais cotidianas. Os jogos de simulação fornecem uma caixa de areia digital na qual podemos interagir com nossos companheiros de IA favoritos de maneiras divertidas e imprevisíveis. A longo prazo, a natureza dos jogos de simulação provavelmente mudará, com esses agentes não apenas brinquedos, mas amigos em potencial, familiares, colegas, conselheiros e até amantes.
Customização personalizada
O objetivo final de um jogo personalizado é fornecer a cada jogador uma experiência de jogo única. Por exemplo, vamos começar com a criação de personagens - desde o jogo de tabuleiro Dungeons & Dragons original até o Genshin Impact de Mihoyo, a criação de personagens tem sido a espinha dorsal de quase todos os jogos de RPG (RPG). A maioria dos RPGs permite que o jogador escolha entre opções predefinidas para personalizar aparência, gênero, classe, etc. Então, como você vai além das predefinições para gerar um personagem único para cada jogador e jogabilidade? Um construtor de caracteres personalizado que combina o LLM com um modelo de difusão de texto para imagem permite isso.
O Arrowmancer da Spellbrush é um RPG baseado no modelo de animação personalizado baseado em GAN da empresa. Em Arrowmancer, os jogadores podem gerar um conjunto completo de personagens únicos de anime, incluindo arte e habilidades de combate. Essa personalização também faz parte de seu sistema de monetização, com jogadores importando personagens criados por IA para banners personalizados de gacha, onde podem ganhar personagens duplicados para fortalecer suas fileiras.
A personalização também se estende aos itens do jogo. Por exemplo, a IA pode ajudar a gerar armas e armaduras exclusivas que estão disponíveis apenas para jogadores que concluem determinadas tarefas. A Azra Games construiu um pipeline de ativos alimentado por IA para criar e gerar rapidamente uma vasta biblioteca de itens no jogo e no mundo, abrindo caminho para uma experiência de jogo mais diversificada. O renomado desenvolvedor AAA Activision Blizzard construiu o sistema Blizzard Diffusion, uma réplica do gerador de imagens Stable Diffusion, para ajudar a gerar arte conceitual para vários personagens e roupas.
O texto e o diálogo do jogo também podem ser personalizados. Os emblemas do mundo podem refletir algum tipo de título ou status que o jogador alcançou. Os NPCs podem ser configurados como agentes LLM com personalidades únicas que se adaptam ao comportamento do jogador. Por exemplo, o diálogo pode mudar com base no comportamento anterior do jogador com o agente. Vimos esse conceito implementado com sucesso em um jogo triplo A, e Shadow of Mordor da Monolith tem um sistema de vingança que cria dinamicamente histórias de fundo interessantes para vilões com base nas ações do jogador. Esses elementos de personalização tornam cada experiência de jogo única.
A editora de jogos Ubisoft revelou recentemente o Ghostwriter, uma ferramenta de conversação desenvolvida por LLMs. Hoje, os editores usam a ferramenta para gerar diálogos automaticamente que ajudam a simular o mundo vivo ao redor dos jogadores.
Do ponto de vista do jogador, a IA aumenta a imersão e a jogabilidade do jogo. A popularidade duradoura dos mods de RPG em jogos imersivos de mundo aberto como Skyrim e Grand Theft Auto V demonstra uma necessidade latente de histórias personalizadas. Ainda hoje, o GTA V tem consistentemente uma contagem maior de jogadores em servidores de RPG do que o jogo original. Acreditamos que, no futuro, os sistemas de personalização se tornarão uma ferramenta operacional integral em tempo real para atrair e reter jogadores em todos os jogos.
Narrativa de IA
Claro, há mais em um bom jogo do que personagens e diálogos. Outro cenário interessante é aproveitar a IA generativa para contar histórias melhores e mais pessoais.
Dungeons & Dragons é o avô da narrativa personalizada em jogos, em que uma pessoa conhecida como "mestre de masmorras" se prepara para contar uma história a um grupo de amigos, cada um desempenhando um papel na história. A história resultante é parte drama improvisado, parte RPG, o que significa que cada jogada é única. Em um sinal da necessidade de contar histórias personalizadas, Dungeons & Dragons está mais popular do que nunca hoje, com vendas digitais e analógicas atingindo recordes.
Hoje, muitas empresas estão aplicando o LLM ao modo de história de Dungeons & Dragons. A oportunidade aqui é para os jogadores passarem seu tempo em seus universos IP ou criados por jogadores favoritos, guiados por um contador de histórias de IA infinitamente paciente. Lançado em 2019, o Latitude's AI Dungeon é um jogo de aventura baseado em texto aberto no qual a IA interpreta o mestre do calabouço. Os usuários também ajustaram a versão GPT-4 do OpenAI para jogar Dungeons & Dragons com resultados promissores. O jogo de aventura de texto do Character.AI é um dos modos mais populares do aplicativo.
Hidden Door vai um passo além, treinando um modelo de aprendizado de máquina em um conjunto específico de material de origem (como O Mágico de Oz) e permitindo que os jogadores se aventurem em um determinado universo IP. Dessa forma, a Hidden Door trabalhou com o proprietário da propriedade intelectual para possibilitar uma nova forma interativa de extensão da marca. Assim que os fãs terminam de assistir a um filme ou livro, eles podem continuar suas aventuras em seus mundos favoritos por meio de eventos personalizados semelhantes a Dungeons & Dragons. A demanda pela experiência dos fãs está crescendo, com o Archiveofourown.org e o Wattpad, os dois maiores repositórios de ficção de fãs on-line, recebendo mais de 354 milhões e 146 milhões de visitas ao site, respectivamente, apenas em maio.
A NovelAI desenvolveu seu próprio LLM Clio, usando-o para contar histórias em um modo sandbox para ajudar escritores humanos a superar problemas de bloqueio de escrita. Para os escritores mais exigentes, o NovelAI permite que os usuários ajustem o Clio com base em seu próprio trabalho ou mesmo no de autores famosos como HP Lovecraft ou Júlio Verne.
Vale a pena notar que existem muitos obstáculos antes que a produção da história de IA esteja totalmente pronta. Hoje, fazer um bom contador de histórias de IA requer muita definição de regras humanas para criar as linhas narrativas que definem uma boa história. A memória e a coerência são muito importantes, o contador de histórias precisa se lembrar do que aconteceu no início da história e ser consistente no fato e no estilo. A interpretabilidade continua sendo um desafio para muitos códigos-fonte fechados que funcionam como uma caixa preta, e os designers de jogos precisam entender como os sistemas se comportam para melhorar a experiência de jogo.
Ao superar esses obstáculos, no entanto, a IA se tornou o co-piloto dos contadores de histórias humanos. Hoje, milhões de escritores usam o ChatGPT para inspirar suas histórias. O estúdio de entretenimento ic reuniu DALL-E, ChatGPT, Midjourney, Eleven Labs e Runway com uma equipe editorial humana para criar um programa de aventura interativo, escolha sua própria, agora transmitido na Netflix.
Construção de mundo dinâmico
Embora as histórias baseadas em texto sejam populares, muitos jogadores também estão ansiosos para ver suas histórias ganharem vida visualmente. Talvez uma das maiores oportunidades para a IA generativa nos jogos seja ajudar a criar mundos vivos nos quais os jogadores passam inúmeras horas imersos.
A visão final é ser capaz de gerar níveis e conteúdo em tempo real à medida que o jogador avança no jogo. O "Mind Game" no romance de ficção científica "Ender's Game" (Jogo do Ender) é um exemplo típico desse tipo de jogo. O Mind Game é um jogo guiado por IA que se adapta em tempo real aos interesses de cada aluno, com o mundo do jogo mudando constantemente com base no comportamento do aluno e qualquer outra informação mental que a IA infere.
Provavelmente, a coisa mais próxima de um "jogo mental" hoje é a série Left 4 Dead da Valve, que usa orientação de IA para ajustar dinamicamente o ritmo e a dificuldade do jogo. Em vez de definir o ponto de spawn dos inimigos (zumbis), o diretor de IA coloca os zumbis em diferentes posições de acordo com o status, habilidades e posição de cada jogador, criando uma experiência única em cada jogo. O diretor também usa efeitos visuais dinâmicos e música para criar a atmosfera do jogo. O fundador da Valve, Gabe Newell, chama esse sistema de "narrativa programada". O aclamado remake de Dead Space da EA usa uma variante do sistema de direção de IA para levar o horror ao extremo.
Embora isso possa parecer um enredo de ficção científica hoje, um dia, com o aprimoramento dos modelos generativos e a aquisição de cálculos e dados suficientes, podemos criar um diretor de IA que pode não apenas criar sustos, mas também criar o próprio mundo.
Vale a pena notar que o conceito de níveis gerados por máquina em jogos não é novo. De Supergiant's Hades a Blizzard's Diablo e Mojang's Minecraft, muitos dos jogos mais populares de hoje usam geração processual, que usa equações e conjuntos de regras executados por designers humanos para criar aleatoriamente níveis que são sempre diferentes. Um conjunto completo de bibliotecas de software foi estabelecido para auxiliar na geração de programas. O SpeedTree da Unity ajuda os desenvolvedores a gerar a folhagem virtual que você pode ter visto nas florestas de Pandora em Avatar ou nas paisagens de Elden Ring.
Um jogo pode combinar um gerador de ativos processuais com LLM na interface do usuário. O jogo "Townscaper" usa um sistema processual que requer apenas que o jogador insira duas informações (a posição e a cor dos blocos), e pode ser rapidamente transformado em uma bela paisagem urbana. Imagine adicionar o Townscaper do LLM à interface do usuário para ajudar os jogadores a iterar trabalhos mais refinados e requintados por meio de prompts de linguagem natural.
Muitos desenvolvedores também estão entusiasmados com o potencial de usar o aprendizado de máquina para aprimorar a geração de programas. Um dia, os designers poderiam gerar iterativamente primeiros rascunhos viáveis de níveis usando modelos treinados em níveis existentes com estilos semelhantes. No início deste ano, Shyam Sudhakaran liderou uma equipe da Universidade de Copenhague que criou o MarioGPT — uma ferramenta GPT2 que gera níveis de Super Mario usando um modelo treinado nos níveis originais de Super Mario 1 e 2. A pesquisa acadêmica nessa área já está em andamento há algum tempo, incluindo um projeto de 2018 usando redes adversárias generativas (GANs) para projetar níveis para o jogo de tiro em primeira pessoa DOOM.
Modelos generativos, usados em conjunto com sistemas processuais, podem acelerar bastante a criação de ativos. Os artistas já começaram a usar modelos de difusão de texto para imagem para arte conceitual e storyboards assistidos por IA. Nesta postagem de blog, o supervisor de efeitos visuais de mainframe Jussi Kemppainen descreve como ele construiu o mundo e os personagens para um jogo de aventura 2.5D com a ajuda de Midjourney e Adobe Firefly.
Técnicas generativas 3D também foram fortemente pesquisadas. A Luma aproveita os Campos de Radiação Neural (NeRFs) para permitir que os consumidores criem ativos 3D fotorrealistas a partir de imagens 2D capturadas em um iPhone. Kaedim usa uma combinação de IA e controle de qualidade humano para criar malhas 3D prontas para produção e é usado atualmente por mais de 225 desenvolvedores de jogos. A CSM lançou recentemente um modelo proprietário que pode gerar modelos 3D a partir de vídeo e imagens.
A construção do mundo em tempo real com modelos de IA é o que importa a longo prazo. Em nossa opinião, no futuro, o jogo inteiro não precisará mais ser renderizado, mas será gerado em tempo de execução usando redes neurais. A tecnologia DLSS da Nvidia já pode gerar novos quadros de jogo de alta resolução em tempo real usando GPUs de nível de consumidor. Talvez um dia você consiga apertar o botão "interagir" em um filme da Netflix e entrar em um mundo onde todas as cenas são geradas na hora e adaptadas ao jogador. No futuro, os jogos não serão diferentes dos filmes.
Vale a pena notar que um mundo gerado dinamicamente por si só não é suficiente para fazer um bom jogo, como evidenciado pela análise de No Man's Sky. A promessa de mundos dinâmicos reside na sua combinação com outros sistemas de jogo (personalização, agentes generativos, etc.) para abrir novas formas de contar histórias. Afinal, a parte mais atraente de "Mind Games" é como ele se molda para Ed, não para o mundo em si.
AI "Copilot"
Embora tenhamos abordado anteriormente o uso de agentes generativos em jogos simulados, há outro caso de uso emergente em que a IA atua como um co-piloto de jogos, guiando-nos durante o jogo e, em alguns casos, até lutando ao nosso lado.
Para jogadores que estão começando em jogos complexos, o papel do co-piloto de IA é imensurável. Por exemplo, um jogo sandbox UGC como Minecraft, Roblox ou Rec Room é um ambiente rico onde os jogadores podem construir quase qualquer coisa que possam imaginar, com os materiais e habilidades certos. Mas o limiar de aprendizado é muito alto e não é fácil para a maioria dos jogadores encontrar uma maneira de começar.
O co-piloto de IA pode tornar qualquer jogador um mestre construtor em jogos UGC, fornecendo instruções passo a passo com base em prompts de texto ou imagens e orientando os jogadores nos erros. Uma boa referência é o conceito de "mestres construtores" no mundo Lego, esses seres raros que têm o dom de poder ver as plantas de qualquer criação que imaginarem quando necessário.
A Microsoft começou a desenvolver um sistema assistido por IA para o Minecraft que usa DALL-E e Github Copilot para permitir que os jogadores injetem ativos e lógica nas sessões do Minecraft por meio de prompts de linguagem natural. A Roblox está integrando ativamente ferramentas de geração de inteligência artificial na plataforma Roblox com a missão de permitir que "todo usuário seja um criador". Desde a codificação com o Github Copilot até a escrita com o ChatGPT, a eficácia dos co-pilotos de IA para cocriação foi comprovada em muitos campos.
Além da coautoria, um LLM treinado em dados de jogos humanos deve ser capaz de entender como se comportar em vários jogos. Com a integração adequada, o agente pode atuar como parceiro quando os amigos do jogador não podem participar, ou como o outro lado em jogos de confronto direto como FIFA e NBA 2k. Tal agente pode participar do jogo a qualquer momento, ganhando ou perdendo, é amável e não culpará o jogador. Ajustados com base em nossos históricos de jogo individuais, esses agentes podem superar amplamente os bots existentes, jogando exatamente da mesma maneira que jogamos ou jogando de maneiras complementares.
Projetos semelhantes foram executados com sucesso em ambientes restritos. O popular jogo de corrida Forza desenvolveu um sistema "Drivatar" que usa aprendizado de máquina para criar um driver de IA para cada jogador humano que imita seu comportamento de direção. Os Drivatars são carregados na nuvem e, quando o parceiro humano está offline, os Drivatars podem ser invocados para competir contra outros jogadores e até ganhar pontos de vitória. O AlphaStar do DeepMind do Google treinou em um conjunto de dados do jogo StarCraft II de "200 anos" para criar um agente que pode jogar contra e vencer profissionais de e-sports humanos.
Como mecânico de jogo, o co-piloto de IA pode até criar modos de jogo totalmente novos. Imagine Fortnite, mas cada jogador tem uma varinha de "mestre construtor" que pode construir instantaneamente torres de atiradores ou pedras flamejantes com instruções. Nesse modo de jogo, o resultado pode depender mais do que a varinha faz (dica) do que da habilidade de apontar a arma.
O "parceiro" de IA perfeito em jogos tem sido uma parte memorável de muitas franquias de jogos populares. Exemplos incluem Cortana no universo Halo, Elle em The Last of Us ou Elizabeth em BioShock Infinite. Espancar bots de computador nunca sai de moda em jogos competitivos - de fritar alienígenas em Space Invaders a combater pisotear em StarCraft, que eventualmente se transformou em seu próprio modo de jogo, Co-op Commander.
À medida que os jogos evoluem para a próxima geração de redes sociais, esperamos que o co-piloto de IA desempenhe um papel social cada vez mais importante. Está bem documentado que adicionar recursos sociais pode aumentar a aderência do jogo, com taxas de retenção até 5 vezes maiores para jogadores com amigos. Em nossa opinião, todos os jogos no futuro terão um co-piloto de IA.
para concluir
Ainda estamos no começo quando se trata de aplicar IA a jogos, e há muitos obstáculos legais, éticos e técnicos que precisam ser resolvidos antes que essas ideias possam ser concretizadas. Atualmente, a propriedade legal e a proteção de direitos autorais para jogos que usam ativos gerados por IA não são claras, a menos que os desenvolvedores possam provar a propriedade de todos os dados usados para treinar modelos. Isso torna difícil para os proprietários de propriedade intelectual licenciada existente usar modelos de IA de terceiros em seus pipelines de produção.
Como compensar os autores, artistas e criadores originais por trás dos dados de treinamento também é uma questão importante. O desafio é que a maioria dos modelos de IA são treinados em dados públicos na internet, a maioria dos quais são obras protegidas por direitos autorais. Em alguns casos, os usuários conseguiram reproduzir o estilo de um artista usando modelos generativos. Ainda é cedo, e a questão da remuneração dos criadores de conteúdo precisa ser devidamente resolvida.
Atualmente, a maioria dos modelos generativos é muito cara para ser executada na nuvem em escala global 24 horas por dia, 7 dias por semana, o que é necessário para operações de jogos modernos. Para manter os custos baixos, os desenvolvedores de aplicativos podem precisar encontrar maneiras de descarregar as cargas de trabalho do modelo para os dispositivos dos usuários finais, mas isso levará tempo.
No entanto, agora está claro que os desenvolvedores e jogadores de jogos têm muito interesse em IA generativa para jogos. Embora também haja muito hype, estamos entusiasmados em ver muitas equipes talentosas neste espaço trabalhando horas extras para criar produtos inovadores.
A oportunidade não é apenas tornar os jogos existentes mais rápidos e baratos, mas criar um novo tipo de jogo de IA que não era possível antes. Ainda não sabemos que forma esses jogos terão, mas sabemos que a história da indústria de jogos tem sido uma tecnologia que permite novas formas de jogo. Com sistemas como agentes generativos, personalização, narrativa de IA, construção dinâmica de mundos e co-pilotos de IA, podemos estar prestes a ver os primeiros jogos "intermináveis" criados por desenvolvedores de IA.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Análise aprofundada do a16z: que nova jogabilidade a IA criará?
Fonte: a16z
Compilação: Nick
Grande parte da discussão inicial da revolução generativa da IA em jogos se concentrou em como as ferramentas de IA poderiam aumentar a eficiência dos criadores de jogos, permitindo que os jogos fossem produzidos mais rapidamente e em maior escala do que antes. A longo prazo, acreditamos que a IA não apenas mudará a maneira como os jogos são criados, mas também a própria natureza dos jogos.
O tempo todo, a IA está ajudando a gerar novas formas de jogos. De masmorras geradas processualmente em Rogue (1980), a máquinas de estado finito em Half-Life (1998), a diretores de jogos de IA em Left 4 Dead (2008). Mais recentemente, os avanços na tecnologia de aprendizado profundo mudaram ainda mais o jogo, permitindo que os computadores gerem novos conteúdos com base em solicitações do usuário e grandes conjuntos de dados.
Agente Gerador
Lançado pela Maxis' SimCity em 1989, o jogo de simulação permite aos jogadores construir e gerenciar uma cidade virtual. Hoje, o jogo de simulação mais popular é o The Sims, onde mais de 70 milhões de jogadores em todo o mundo gerenciam pessoas virtuais conhecidas como "sims" e as deixam cuidar de suas vidas diárias. O designer Will Wright certa vez descreveu The Sims como uma "casa de bonecas interativa".
No início deste ano, uma equipe de pesquisa da Universidade de Stanford e do Google publicou um artigo mostrando como aplicar o LLM a agentes em jogos. Liderada pelo estudante de doutorado Joon Sung Park, a equipe de pesquisa incorporou 25 agentes semelhantes aos Sims em um mundo de sandbox de pixel art cujo comportamento foi determinado pelo ChatGPT e uma arquitetura que estende o LLM para usar linguagem natural para armazenar um registro completo da experiência de um agente, sintetizar essas memórias em reflexão de nível superior e recuperá-las dinamicamente para planejar o comportamento.
Esses resultados são uma excelente prévia do potencial futuro dos jogos de simulação. Começando com uma sugestão especificada pelo usuário de que um agente deseja oferecer uma festa de Dia dos Namorados, os agentes distribuem convites para festas de forma independente, fazem novas amizades, convidam uns aos outros para encontros e se coordenam para chegar à festa no horário dois dias depois.
Esse comportamento é possível porque os LLMs são treinados em dados de redes sociais, de modo que seus modelos incluem os fundamentos de como os humanos conversam entre si e se comportam em vários contextos sociais. E em ambientes digitais interativos, como jogos analógicos, essas respostas podem ser acionadas para criar um comportamento realista.
Os próprios agentes também podem ser personalizados, baseando-se em nossas aspirações imaginativas para um jogo de "Casa de Bonecas". Os jogadores podem criar um agente ideal com base em si mesmos ou em personagens fictícios. "Ready Player Me" permite que os usuários gerem seu próprio avatar 3D tirando uma selfie e importando o avatar para mais de 9.000 jogos/aplicativos. As plataformas de personagens AI Character.ai, InWorld e Convai podem criar NPCs personalizados com suas próprias histórias de fundo, personalidades e controles comportamentais.
Com recursos de linguagem natural, a forma como interagimos com os agentes também foi expandida. Hoje, os desenvolvedores podem usar os modelos de conversão de texto em fala da Eleven Labs para gerar vozes realistas para seus agentes. A Convai recentemente fez parceria com a Nvidia para uma demonstração bem divulgada na qual os jogadores podem se envolver em uma conversa de voz natural com um NPC de chef de ramen de IA, com o diálogo e as expressões faciais combinadas geradas em tempo real. O aplicativo complementar de AI Replika já permite que os usuários conversem com seus amigos por voz, vídeo e AR/VR. No futuro, pode-se imaginar um jogo de simulação em que os jogadores possam manter contato com seus agentes por telefone ou bate-papo por vídeo durante a viagem e, em seguida, clicar em um jogo mais envolvente quando retornarem ao computador.
No entanto, ainda há muitos desafios a serem resolvidos antes que possamos ver uma versão totalmente gerada do The Sims. Os dados de treinamento para LLMs têm vieses inerentes que podem ser refletidos no comportamento do agente. Jogos de serviço em tempo real 24 horas por dia, 7 dias por semana O custo de executar simulações em grande escala pode não ser economicamente viável, executar 25 agentes em 2 dias custaria à equipe de pesquisa milhares de dólares em computação. Os esforços para descarregar as cargas de trabalho do modelo para os dispositivos são promissores, mas ainda relativamente cedo. Também podemos precisar desenvolver novas normas em torno de relacionamentos quase sociais com agentes.
Mas uma coisa é certa, há uma enorme demanda por agentes generativos no momento. Em nossa pesquisa recente, 61% dos estúdios de jogos planejam experimentar NPCs de IA. Acreditamos que os companheiros de IA logo se tornarão comuns à medida que os agentes entrarem em nossas esferas sociais cotidianas. Os jogos de simulação fornecem uma caixa de areia digital na qual podemos interagir com nossos companheiros de IA favoritos de maneiras divertidas e imprevisíveis. A longo prazo, a natureza dos jogos de simulação provavelmente mudará, com esses agentes não apenas brinquedos, mas amigos em potencial, familiares, colegas, conselheiros e até amantes.
Customização personalizada
O objetivo final de um jogo personalizado é fornecer a cada jogador uma experiência de jogo única. Por exemplo, vamos começar com a criação de personagens - desde o jogo de tabuleiro Dungeons & Dragons original até o Genshin Impact de Mihoyo, a criação de personagens tem sido a espinha dorsal de quase todos os jogos de RPG (RPG). A maioria dos RPGs permite que o jogador escolha entre opções predefinidas para personalizar aparência, gênero, classe, etc. Então, como você vai além das predefinições para gerar um personagem único para cada jogador e jogabilidade? Um construtor de caracteres personalizado que combina o LLM com um modelo de difusão de texto para imagem permite isso.
O Arrowmancer da Spellbrush é um RPG baseado no modelo de animação personalizado baseado em GAN da empresa. Em Arrowmancer, os jogadores podem gerar um conjunto completo de personagens únicos de anime, incluindo arte e habilidades de combate. Essa personalização também faz parte de seu sistema de monetização, com jogadores importando personagens criados por IA para banners personalizados de gacha, onde podem ganhar personagens duplicados para fortalecer suas fileiras.
O texto e o diálogo do jogo também podem ser personalizados. Os emblemas do mundo podem refletir algum tipo de título ou status que o jogador alcançou. Os NPCs podem ser configurados como agentes LLM com personalidades únicas que se adaptam ao comportamento do jogador. Por exemplo, o diálogo pode mudar com base no comportamento anterior do jogador com o agente. Vimos esse conceito implementado com sucesso em um jogo triplo A, e Shadow of Mordor da Monolith tem um sistema de vingança que cria dinamicamente histórias de fundo interessantes para vilões com base nas ações do jogador. Esses elementos de personalização tornam cada experiência de jogo única.
A editora de jogos Ubisoft revelou recentemente o Ghostwriter, uma ferramenta de conversação desenvolvida por LLMs. Hoje, os editores usam a ferramenta para gerar diálogos automaticamente que ajudam a simular o mundo vivo ao redor dos jogadores.
Do ponto de vista do jogador, a IA aumenta a imersão e a jogabilidade do jogo. A popularidade duradoura dos mods de RPG em jogos imersivos de mundo aberto como Skyrim e Grand Theft Auto V demonstra uma necessidade latente de histórias personalizadas. Ainda hoje, o GTA V tem consistentemente uma contagem maior de jogadores em servidores de RPG do que o jogo original. Acreditamos que, no futuro, os sistemas de personalização se tornarão uma ferramenta operacional integral em tempo real para atrair e reter jogadores em todos os jogos.
Narrativa de IA
Claro, há mais em um bom jogo do que personagens e diálogos. Outro cenário interessante é aproveitar a IA generativa para contar histórias melhores e mais pessoais.
Dungeons & Dragons é o avô da narrativa personalizada em jogos, em que uma pessoa conhecida como "mestre de masmorras" se prepara para contar uma história a um grupo de amigos, cada um desempenhando um papel na história. A história resultante é parte drama improvisado, parte RPG, o que significa que cada jogada é única. Em um sinal da necessidade de contar histórias personalizadas, Dungeons & Dragons está mais popular do que nunca hoje, com vendas digitais e analógicas atingindo recordes.
Hoje, muitas empresas estão aplicando o LLM ao modo de história de Dungeons & Dragons. A oportunidade aqui é para os jogadores passarem seu tempo em seus universos IP ou criados por jogadores favoritos, guiados por um contador de histórias de IA infinitamente paciente. Lançado em 2019, o Latitude's AI Dungeon é um jogo de aventura baseado em texto aberto no qual a IA interpreta o mestre do calabouço. Os usuários também ajustaram a versão GPT-4 do OpenAI para jogar Dungeons & Dragons com resultados promissores. O jogo de aventura de texto do Character.AI é um dos modos mais populares do aplicativo.
Hidden Door vai um passo além, treinando um modelo de aprendizado de máquina em um conjunto específico de material de origem (como O Mágico de Oz) e permitindo que os jogadores se aventurem em um determinado universo IP. Dessa forma, a Hidden Door trabalhou com o proprietário da propriedade intelectual para possibilitar uma nova forma interativa de extensão da marca. Assim que os fãs terminam de assistir a um filme ou livro, eles podem continuar suas aventuras em seus mundos favoritos por meio de eventos personalizados semelhantes a Dungeons & Dragons. A demanda pela experiência dos fãs está crescendo, com o Archiveofourown.org e o Wattpad, os dois maiores repositórios de ficção de fãs on-line, recebendo mais de 354 milhões e 146 milhões de visitas ao site, respectivamente, apenas em maio.
Vale a pena notar que existem muitos obstáculos antes que a produção da história de IA esteja totalmente pronta. Hoje, fazer um bom contador de histórias de IA requer muita definição de regras humanas para criar as linhas narrativas que definem uma boa história. A memória e a coerência são muito importantes, o contador de histórias precisa se lembrar do que aconteceu no início da história e ser consistente no fato e no estilo. A interpretabilidade continua sendo um desafio para muitos códigos-fonte fechados que funcionam como uma caixa preta, e os designers de jogos precisam entender como os sistemas se comportam para melhorar a experiência de jogo.
Ao superar esses obstáculos, no entanto, a IA se tornou o co-piloto dos contadores de histórias humanos. Hoje, milhões de escritores usam o ChatGPT para inspirar suas histórias. O estúdio de entretenimento ic reuniu DALL-E, ChatGPT, Midjourney, Eleven Labs e Runway com uma equipe editorial humana para criar um programa de aventura interativo, escolha sua própria, agora transmitido na Netflix.
Construção de mundo dinâmico
Embora as histórias baseadas em texto sejam populares, muitos jogadores também estão ansiosos para ver suas histórias ganharem vida visualmente. Talvez uma das maiores oportunidades para a IA generativa nos jogos seja ajudar a criar mundos vivos nos quais os jogadores passam inúmeras horas imersos.
A visão final é ser capaz de gerar níveis e conteúdo em tempo real à medida que o jogador avança no jogo. O "Mind Game" no romance de ficção científica "Ender's Game" (Jogo do Ender) é um exemplo típico desse tipo de jogo. O Mind Game é um jogo guiado por IA que se adapta em tempo real aos interesses de cada aluno, com o mundo do jogo mudando constantemente com base no comportamento do aluno e qualquer outra informação mental que a IA infere.
Provavelmente, a coisa mais próxima de um "jogo mental" hoje é a série Left 4 Dead da Valve, que usa orientação de IA para ajustar dinamicamente o ritmo e a dificuldade do jogo. Em vez de definir o ponto de spawn dos inimigos (zumbis), o diretor de IA coloca os zumbis em diferentes posições de acordo com o status, habilidades e posição de cada jogador, criando uma experiência única em cada jogo. O diretor também usa efeitos visuais dinâmicos e música para criar a atmosfera do jogo. O fundador da Valve, Gabe Newell, chama esse sistema de "narrativa programada". O aclamado remake de Dead Space da EA usa uma variante do sistema de direção de IA para levar o horror ao extremo.
Embora isso possa parecer um enredo de ficção científica hoje, um dia, com o aprimoramento dos modelos generativos e a aquisição de cálculos e dados suficientes, podemos criar um diretor de IA que pode não apenas criar sustos, mas também criar o próprio mundo.
Vale a pena notar que o conceito de níveis gerados por máquina em jogos não é novo. De Supergiant's Hades a Blizzard's Diablo e Mojang's Minecraft, muitos dos jogos mais populares de hoje usam geração processual, que usa equações e conjuntos de regras executados por designers humanos para criar aleatoriamente níveis que são sempre diferentes. Um conjunto completo de bibliotecas de software foi estabelecido para auxiliar na geração de programas. O SpeedTree da Unity ajuda os desenvolvedores a gerar a folhagem virtual que você pode ter visto nas florestas de Pandora em Avatar ou nas paisagens de Elden Ring.
Um jogo pode combinar um gerador de ativos processuais com LLM na interface do usuário. O jogo "Townscaper" usa um sistema processual que requer apenas que o jogador insira duas informações (a posição e a cor dos blocos), e pode ser rapidamente transformado em uma bela paisagem urbana. Imagine adicionar o Townscaper do LLM à interface do usuário para ajudar os jogadores a iterar trabalhos mais refinados e requintados por meio de prompts de linguagem natural.
Modelos generativos, usados em conjunto com sistemas processuais, podem acelerar bastante a criação de ativos. Os artistas já começaram a usar modelos de difusão de texto para imagem para arte conceitual e storyboards assistidos por IA. Nesta postagem de blog, o supervisor de efeitos visuais de mainframe Jussi Kemppainen descreve como ele construiu o mundo e os personagens para um jogo de aventura 2.5D com a ajuda de Midjourney e Adobe Firefly.
A construção do mundo em tempo real com modelos de IA é o que importa a longo prazo. Em nossa opinião, no futuro, o jogo inteiro não precisará mais ser renderizado, mas será gerado em tempo de execução usando redes neurais. A tecnologia DLSS da Nvidia já pode gerar novos quadros de jogo de alta resolução em tempo real usando GPUs de nível de consumidor. Talvez um dia você consiga apertar o botão "interagir" em um filme da Netflix e entrar em um mundo onde todas as cenas são geradas na hora e adaptadas ao jogador. No futuro, os jogos não serão diferentes dos filmes.
Vale a pena notar que um mundo gerado dinamicamente por si só não é suficiente para fazer um bom jogo, como evidenciado pela análise de No Man's Sky. A promessa de mundos dinâmicos reside na sua combinação com outros sistemas de jogo (personalização, agentes generativos, etc.) para abrir novas formas de contar histórias. Afinal, a parte mais atraente de "Mind Games" é como ele se molda para Ed, não para o mundo em si.
AI "Copilot"
Embora tenhamos abordado anteriormente o uso de agentes generativos em jogos simulados, há outro caso de uso emergente em que a IA atua como um co-piloto de jogos, guiando-nos durante o jogo e, em alguns casos, até lutando ao nosso lado.
Para jogadores que estão começando em jogos complexos, o papel do co-piloto de IA é imensurável. Por exemplo, um jogo sandbox UGC como Minecraft, Roblox ou Rec Room é um ambiente rico onde os jogadores podem construir quase qualquer coisa que possam imaginar, com os materiais e habilidades certos. Mas o limiar de aprendizado é muito alto e não é fácil para a maioria dos jogadores encontrar uma maneira de começar.
O co-piloto de IA pode tornar qualquer jogador um mestre construtor em jogos UGC, fornecendo instruções passo a passo com base em prompts de texto ou imagens e orientando os jogadores nos erros. Uma boa referência é o conceito de "mestres construtores" no mundo Lego, esses seres raros que têm o dom de poder ver as plantas de qualquer criação que imaginarem quando necessário.
A Microsoft começou a desenvolver um sistema assistido por IA para o Minecraft que usa DALL-E e Github Copilot para permitir que os jogadores injetem ativos e lógica nas sessões do Minecraft por meio de prompts de linguagem natural. A Roblox está integrando ativamente ferramentas de geração de inteligência artificial na plataforma Roblox com a missão de permitir que "todo usuário seja um criador". Desde a codificação com o Github Copilot até a escrita com o ChatGPT, a eficácia dos co-pilotos de IA para cocriação foi comprovada em muitos campos.
Projetos semelhantes foram executados com sucesso em ambientes restritos. O popular jogo de corrida Forza desenvolveu um sistema "Drivatar" que usa aprendizado de máquina para criar um driver de IA para cada jogador humano que imita seu comportamento de direção. Os Drivatars são carregados na nuvem e, quando o parceiro humano está offline, os Drivatars podem ser invocados para competir contra outros jogadores e até ganhar pontos de vitória. O AlphaStar do DeepMind do Google treinou em um conjunto de dados do jogo StarCraft II de "200 anos" para criar um agente que pode jogar contra e vencer profissionais de e-sports humanos.
Como mecânico de jogo, o co-piloto de IA pode até criar modos de jogo totalmente novos. Imagine Fortnite, mas cada jogador tem uma varinha de "mestre construtor" que pode construir instantaneamente torres de atiradores ou pedras flamejantes com instruções. Nesse modo de jogo, o resultado pode depender mais do que a varinha faz (dica) do que da habilidade de apontar a arma.
O "parceiro" de IA perfeito em jogos tem sido uma parte memorável de muitas franquias de jogos populares. Exemplos incluem Cortana no universo Halo, Elle em The Last of Us ou Elizabeth em BioShock Infinite. Espancar bots de computador nunca sai de moda em jogos competitivos - de fritar alienígenas em Space Invaders a combater pisotear em StarCraft, que eventualmente se transformou em seu próprio modo de jogo, Co-op Commander.
para concluir
Ainda estamos no começo quando se trata de aplicar IA a jogos, e há muitos obstáculos legais, éticos e técnicos que precisam ser resolvidos antes que essas ideias possam ser concretizadas. Atualmente, a propriedade legal e a proteção de direitos autorais para jogos que usam ativos gerados por IA não são claras, a menos que os desenvolvedores possam provar a propriedade de todos os dados usados para treinar modelos. Isso torna difícil para os proprietários de propriedade intelectual licenciada existente usar modelos de IA de terceiros em seus pipelines de produção.
Como compensar os autores, artistas e criadores originais por trás dos dados de treinamento também é uma questão importante. O desafio é que a maioria dos modelos de IA são treinados em dados públicos na internet, a maioria dos quais são obras protegidas por direitos autorais. Em alguns casos, os usuários conseguiram reproduzir o estilo de um artista usando modelos generativos. Ainda é cedo, e a questão da remuneração dos criadores de conteúdo precisa ser devidamente resolvida.
Atualmente, a maioria dos modelos generativos é muito cara para ser executada na nuvem em escala global 24 horas por dia, 7 dias por semana, o que é necessário para operações de jogos modernos. Para manter os custos baixos, os desenvolvedores de aplicativos podem precisar encontrar maneiras de descarregar as cargas de trabalho do modelo para os dispositivos dos usuários finais, mas isso levará tempo.
No entanto, agora está claro que os desenvolvedores e jogadores de jogos têm muito interesse em IA generativa para jogos. Embora também haja muito hype, estamos entusiasmados em ver muitas equipes talentosas neste espaço trabalhando horas extras para criar produtos inovadores.
A oportunidade não é apenas tornar os jogos existentes mais rápidos e baratos, mas criar um novo tipo de jogo de IA que não era possível antes. Ainda não sabemos que forma esses jogos terão, mas sabemos que a história da indústria de jogos tem sido uma tecnologia que permite novas formas de jogo. Com sistemas como agentes generativos, personalização, narrativa de IA, construção dinâmica de mundos e co-pilotos de IA, podemos estar prestes a ver os primeiros jogos "intermináveis" criados por desenvolvedores de IA.