Microsoft Build 2026 Conferência de Desenvolvedores: Chegou a era "Agente em primeiro lugar", lançando sete modelos próprios de uma só vez

Texto丨Li Hailun

Edição丨Xu Qingyang

No horário local dos EUA, 2 de junho, a Microsoft Build 2026, conferência de desenvolvedores, foi inaugurada em San Francisco, no Masonberg. O tema da conferência focou na aplicação prática das tecnologias de IA de ponta, com a Microsoft lançando uma série de produtos e atualizações que abrangem modelos de IA próprios, aplicações de agentes inteligentes, segurança do sistema operacional, ferramentas para desenvolvedores, serviços em nuvem e novas plataformas de hardware.

Na conferência de desenvolvedores de 2025, a Microsoft estabeleceu a direção da “Era dos Agentes de IA”, lançando o Copilot Studio para orquestração de múltiplos agentes, o Windows AI Foundry, e anunciou suporte completo ao Model Context Protocol, além do lançamento do agente de programação Copilot Coding Agent.

Na narrativa da Microsoft, 2025 resolveu a questão de “qual padrão e estrutura usar na era dos agentes inteligentes”, enquanto 2026 se concentra em “como usar seus próprios modelos e produtos para realmente colocar tudo em funcionamento” — a camada de modelos foi reforçada com a inclusão de uma força motriz própria capaz de liderar, e na camada de produtos, os agentes passaram de demonstrações para implementação de sistema, hardware e nuvem em toda a cadeia.

A apresentação deste ano pode ser dividida em seis blocos principais: a família de modelos de IA próprios MAI, o ecossistema de agentes representado pelo Scout e GitHub Copilot, o sandbox de segurança de IA no nível do sistema Windows MXC, o Surface RTX Spark Dev Box e otimizações de sistema para desenvolvedores, a nova plataforma de dispositivos de agentes Project Solara, além de ferramentas de desenvolvedor e frameworks de governança como Microsoft IQ, Rayfin, ASSERT, ACS, entre outros.

01 Sete modelos treinados do zero, rejeitando destilação

A palestra principal foi conduzida pelo CEO da Microsoft, Satya Nadella, com sua visão como fio condutor. Após apresentar a estratégia “Prioridade aos Agentes”, executivos de diversas áreas subiram ao palco para lançar produtos concretos que implementam essa estratégia.

Na conferência, Suleiman anunciou sete novos modelos desenvolvidos internamente pela IA da Microsoft, todos agrupados na família MAI.

Ele descreveu a missão do MAI como construir uma “máquina de escalar montanhas”, que, por meio de investimentos contínuos em capacidade computacional, dados de melhor qualidade e avaliações mais precisas, realize melhorias cíclicas, mantendo os usuários na vanguarda tecnológica.

Quanto à escala de cálculo de treinamento, Suleiman apontou que a quantidade de computação usada para treinar modelos de ponta cresceu 1 trilhão de vezes, com previsão de mais um aumento de mil vezes nos próximos três anos. Todos os modelos MAI da Microsoft “começam do zero, sem destilação”, ou seja, não dependem de saídas de modelos de terceiros para treinamento.

Responsável pelo departamento de IA da Microsoft, Suleiman apresentou os sete modelos próprios:

O modelo de inferência principal MAI-Thinking-1, de porte médio. A Microsoft afirmou que, em testes críticos de engenharia de software, seu desempenho é comparável aos melhores modelos do mercado. Em testes às cegas, a preferência dos avaliadores humanos ficou ao nível do Sonnet 4.6. Este modelo foi treinado do zero, com dados limpos, sem usar destilação de modelos de terceiros.

O modelo de programação MAI-Code-1-Flash, um agente de codificação eficiente, com 5 bilhões de parâmetros, projetado e integrado profundamente ao GitHub Copilot, VS Code e ao stack tecnológico da Microsoft. A Microsoft afirmou que seu desempenho é comparável ao Haiku, porém com custos menores.

O modelo de geração de imagens MAI-Image-2.5 e sua variante ultra eficiente Flash, que suporta geração de imagens a partir de texto e edição de imagens, sendo superior ao Nano Banana Pro do Google na pontuação Arena.

O modelo de transcrição MAI-Transcribe-1.5, com precisão de nível SOTA. Alega-se que é cinco vezes mais rápido que modelos concorrentes, com suporte embutido para reconhecimento de terminologia específica de 43 idiomas.

O modelo de geração de voz MAI-Voice-2, que oferece uma fala de alta qualidade e naturalidade, suportando 15 idiomas, capaz de adaptar a voz a partir de amostras curtas, com medidas de proteção contra uso indevido. Sua variante Flash será lançada em breve, com custos menores para alcançar a mesma funcionalidade.

Todos os modelos compartilham as mesmas normas de dados, infraestrutura e frameworks de avaliação. Além de serem distribuídos na Azure Foundry e otimizados para produtos próprios da Microsoft, também estarão disponíveis para desenvolvedores na Open Router, Fireworks e Baseten. Pela primeira vez, desenvolvedores poderão ajustar os pesos dos modelos por conta própria.

Na apresentação, Nadella introduziu o Microsoft Frontier Tuning, uma abordagem que permite às empresas personalizar modelos com seus próprios dados de trabalho. A lógica é que os dados mais valiosos não são os corpus genéricos, mas as trajetórias, passos e decisões reais de agentes inteligentes executando tarefas em ambientes empresariais.

Nadella explicou: “Você está construindo seu próprio modelo: treinando-o com seus dados, em seu ambiente, sob seu controle. Seu conhecimento institucional se torna parte do modelo, e só seu.”

Em termos de resultados, o modelo MAI ajustado para Excel alcança desempenho equivalente ao GPT-5.4, com eficiência 10 vezes maior. Após usar Frontier Tuning, a Microsoft afirma que o MAI obteve a maior taxa de sucesso em todos os testes, com redução de custos em torno de 10 vezes.

Na área de saúde, a Microsoft anunciou uma parceria com o Mayo Clinic para criar um modelo de IA avançado para cuidados médicos. Este modelo combinará o conhecimento clínico do Mayo, dados clínicos desidentificados e insights longitudinais com as capacidades de IA da Microsoft.

A Microsoft também revelou que os modelos MAI estão sendo co-desenhados com seu próprio chip Maia 200, com otimizações de hardware e software que já proporcionaram um aumento de 1,4 vez na eficiência.

02 Ecossistema de agentes totalmente implementado

Na conferência, a Microsoft anunciou uma grande transformação para uma “prioridade aos agentes”, visando automatizar a forma como trabalhadores do conhecimento usam softwares, integrando assistentes de IA às interações diárias de trabalho.

Scout é o principal produto de agentes anunciado. Este agente de IA, chamado de “eternamente online”, foi construído sobre a estrutura OpenClaw, podendo interagir com colegas humanos no Microsoft Teams.

Scout consegue navegar por mensagens de trabalho, calendário e caixa de entrada de e-mails, automatizar tarefas, reagendar reuniões conflitantes e redigir respostas profissionais. Os usuários podem enviar comandos diretamente pelo Teams ou nomear o agente.

O vice-presidente corporativo Omar Shahin explicou a concepção do Scout: “Sua empresa, na essência, é como contratar seu assistente pessoal. Ter um assistente privado significa que, mesmo quando você não está trabalhando, ele continua trabalhando.”

O Scout é oferecido via o programa Microsoft Frontier, mediante assinatura do GitHub Copilot. A Microsoft está testando uma versão desktop do Scout, que será disponibilizada para assinantes com acesso à funcionalidade “Frontier”. Internamente, Shahin afirmou que o maior grupo de uso e crescimento do ferramenta é o departamento de vendas.

Outro lançamento importante foi o aplicativo de desktop do GitHub Copilot. Mario Rodriguez, chefe de produto do GitHub, explicou que trata-se de uma experiência nativa de agente, construída sobre o GitHub, para desktop.

Com uma visão unificada “My Work”, os desenvolvedores podem acompanhar atividades em múltiplos repositórios, incluindo sessões ativas, tópicos, pull requests e automações em segundo plano. Cada sessão roda em seu próprio Git worktree, com agentes operando de forma paralela e independente. O aplicativo possui função de Agent Merge, que conduz revisões, verificações e fusões de pull requests. A interface Canvas permite interação bidirecional entre humanos e agentes, possibilitando inspeção, orientação e validação do trabalho realizado pelos agentes em nome do usuário.

O aplicativo do GitHub Copilot para desktop está em prévia técnica para Windows 11, Windows 11 on Arm, Mac e Linux, requer assinatura do Copilot, e futuramente será aberto ao público na versão gratuita. Suporta ambientes em nuvem e sandbox local, com políticas de segurança integradas.

Na área de governança de segurança de agentes, a Microsoft lançou o ACS (Agent Control Standard), um novo padrão de código aberto que oferece uma abordagem mais consistente e granular para controlar o comportamento de agentes de IA. O ACS permite que equipes de desenvolvimento, conformidade e segurança criem arquivos de política que definem o que o agente pode fazer, o que não pode fazer, quando precisa de aprovação humana e quais evidências devem ser registradas para auditoria.

O ACS é disponibilizado como SDK, com plugins para LangChain, OpenAI Agents SDK, Anthropic Agents SDK, AutoGen, CrewAI, Semantic Kernel, Microsoft.Extensions.AI, MCP, entre outros. Como as políticas podem ser escritas em um único arquivo, podem ser incorporadas ao agente, acompanhando-o em diferentes frameworks e ambientes.

ASSERT (Avaliação baseada em Especificações Adaptativas para Testes de Regressão e Avaliação) é outra ferramenta de testes. Trata-se de um framework open source que, usando IA, converte descrições em linguagem natural de alto nível sobre objetivos, estratégias ou comportamentos esperados em avaliações estruturadas.

ASSERT recebe descrições sucintas do comportamento esperado de modelos de IA, gera conjuntos de comportamentos aceitáveis e inaceitáveis, cenários problemáticos e casos de teste, executa testes no sistema alvo e fornece pontuações. Também registra os caminhos tomados pelo sistema de IA, incluindo operações intermediárias e chamadas de ferramentas, para que os desenvolvedores possam verificar onde falharam.

03 Quanto mais autônico, mais perigoso: a Microsoft usa MXC para estabelecer limites no sistema

À medida que os agentes de IA se tornam mais poderosos e autônomos, a Microsoft identificou uma questão crítica: quanto mais autônicos, mais úteis, mas também mais perigosos, pois podem operar sem restrições na rede corporativa. Em seu blog oficial, a empresa descreveu isso como um “problema de sistema em múltiplas camadas”, onde cada interação entre agente, humanos, ferramentas, aplicações, modelos e outros agentes “expõe novas superfícies de ataque e introduz diferentes modos de falha”.

Para mitigar esse risco, a Microsoft lançou o Microsoft Execution Containers (MXC), uma camada de execução baseada em políticas, integrada ao próprio sistema operacional Windows. Pavan Dadhwuri, vice-presidente de execução do Windows e dispositivos, destacou que isso é fundamental para tornar os agentes de IA viáveis comercialmente, pois eles “são construídos com foco em segurança, contenção, isolamento e controle do usuário”, garantindo que sejam seguros para consumidores e empresas.

Nadella apresentou o sistema de sandbox de segurança de nível de sistema MXC

O MXC é, na essência, um SDK e um modelo de políticas embutidos no Windows e no Windows Subsystem for Linux, oferecendo o que a Microsoft chama de “espectro de sandboxs compostos”. Este espectro vai desde isolamento leve de processos (já adotado na interface de linha de comando do GitHub Copilot), até máquinas virtuais menores, containers Linux e instâncias completas na nuvem rodando no Windows 365.

O sistema isola a execução do agente do desktop, da área de transferência, da interface e dos dispositivos de entrada do usuário. Cada agente é vinculado a uma identidade, seja uma ID local ou uma identidade provisionada na nuvem suportada pelo Microsoft Entra, garantindo que cada ação do agente possa ser atribuída, auditada e governada.

O MXC já está em prévia inicial. Uma versão de pré-visualização do Agent 365, integrada ao ecossistema de segurança empresarial da Microsoft, será lançada em julho de 2026, combinando Entra, Intune, Defender e Purview para gerenciamento e governança centralizados dos agentes isolados.

No lado dos parceiros, OpenAI, Nvidia, Manus, Nous Research (fabricante do Hermes Agent) e o projeto open source OpenClaw anunciaram que estão construindo sobre o MXC.

Vale destacar que a parceria com OpenClaw começou quando Peter Steinberger, criador do projeto, entrou em contato com a Microsoft demonstrando interesse em colaborar, o que evoluiu para uma parceria de plataforma completa.

04 Três atualizações para fazer o AI do Edge rodar “offline”

O navegador Edge da Microsoft também recebeu melhorias na capacidade de IA local. Desde a introdução do Phi-4-mini na Build 2025, a equipe expandiu as capacidades de IA no dispositivo, com base no feedback dos desenvolvedores web.

A primeira é o Aion-1.0-Instruct, um modelo de linguagem local menor, mais rápido e mais eficiente que o Phi-4-mini. Pode rodar em PCs com GPU e CPU mais fracos, atualmente disponível em prévia para desenvolvedores, com lançamento na Hugging Face em julho.

A segunda é uma API de detecção de idioma e tradução, disponível na versão 148 do Edge. Essas APIs, alimentadas por modelos de IA embutidos no Edge, permitem que sites e extensões identifiquem o idioma do texto e façam traduções entre pares de idiomas. A Microsoft afirma que oferece traduções rápidas e de alta qualidade, suportando mais de 145 idiomas, otimizadas para cargas de trabalho na web, e que o serviço é gratuito.

A terceira é a implementação de reconhecimento de fala via Web Speech API, disponível experimentalmente no Edge Canary e Dev. Essa API ajuda desenvolvedores a integrar entrada de voz ou áudio em sites e extensões, rodando localmente no dispositivo ou usando serviços de transcrição e síntese de voz na nuvem.

05 Ferramentas de desenvolvedor e serviços em nuvem em evolução

Na camada de inteligência de dados, a Microsoft lançou o Microsoft IQ, que consolida quatro fontes de contexto anteriormente independentes em uma base comum para agentes.

O CTO da Microsoft Fabric, Amir Nezati, fez uma analogia: “As cascatas de código verde de Matrix não são apenas decoração, são a fundação daquele mundo. O que fazemos no mundo de dados é criar uma realidade baseada em dados para os agentes.”

As quatro fontes de contexto do Microsoft IQ são: Work IQ, que captura o funcionamento diário da organização usando e-mails, documentos, reuniões e agendas; Foundry IQ, que gerencia o conhecimento institucional, planejando e indexando bases de conhecimento; Fabric IQ, que modela o estado operacional em tempo real da empresa usando dados, definindo entidades, relações e regras de negócio baseadas em sinais em tempo real, com lançamento previsto para os próximos meses; Web IQ, que adiciona contexto global em tempo real da internet.

Com essa estrutura de contexto, o agente deixa de ser apenas uma ferramenta que executa comandos, tornando-se um funcionário virtual que entende o funcionamento da empresa.

Mas ter uma “fundação” compartilhada não basta. Quando o agente começa a gerar aplicações, cada uma precisa de um backend. Caso contrário, novas ilhas de dados podem se formar fora do contexto. Para evitar isso, a Microsoft lançou o Rayfin, um SDK e CLI open source que permite implantar aplicações construídas por agentes diretamente na plataforma Fabric, como backends de produção sob governança. Os dados dessas aplicações entram por padrão no data lake unificado OneLake, alimentando o Microsoft IQ, ao invés de se acumularem externamente.

A Microsoft posiciona o Rayfin como concorrente do Supabase e Neon, com a principal diferença na governança: todas as aplicações usam o mesmo canal de dados e conformidade. Nezati explica que é um processo bidirecional: ao construir aplicações, o agente extrai informações das regras de dados da empresa, e os dados gerados pelas aplicações atualizam essas regras, permitindo que o próximo agente use as informações mais recentes.

A Microsoft também lançou o suporte a containers WSL, permitindo que desenvolvedores criem e gerenciem containers Linux diretamente no Windows, com CLI e API, para rodar containers Linux em aplicações Windows locais. Essa funcionalidade estará disponível em prévia pública nos próximos meses.

Para evitar que desenvolvedores gastem tempo demais na configuração de ambientes, a Microsoft lançou o Windows Developer Configurations, que permite configurar rapidamente uma nova máquina com otimizações para desenvolvimento, incluindo instalação automática do WSL, PowerShell 7, Visual Studio Code, além de ativar o controle de versão Git e mostrar arquivos ocultos no explorador de arquivos.

06 Dois novos hardwares trazem IA de volta ao local

A Build não foi só uma vitrine de modelos, agentes e ferramentas de software; o hardware também esteve presente. Com o aumento do consumo de poder de processamento por IA e workflows de agentes contínuos, a Microsoft decidiu focar nos dispositivos ao alcance dos desenvolvedores, ao invés de depender sempre de aluguel de GPUs na nuvem.

O vice-presidente do Surface, Andrew Hill, anunciou dois novos dispositivos:

Surface RTX Spark Dev Box é um PC de desenvolvimento compacto, equipado com o superchip NVIDIA RTX Spark, combinando GPU NVIDIA Blackwell RTX e CPU NVIDIA Grace, oferecendo até 1 Petaflop de capacidade de IA, com 128 GB de memória unificada.

O dispositivo possui uma caixa de alumínio que funciona como dissipador de calor, projetada para tarefas de treinamento prolongado, inferência de grandes modelos e fluxos de trabalho complexos de agentes. Vem com Windows 11 Pro pré-instalado, com configurações otimizadas: tema escuro, barra de tarefas simplificada, remoção de widgets, modo “Não Perturbe”, modo de desenvolvedor ativado, PowerShell 7 como shell padrão, WSL 2 com suporte a GPU e CUDA, além de Visual Studio Code, GitHub Copilot, Git, Python e Node.js já instalados.

Na segurança, o Surface RTX Spark Dev Box é baseado em princípios de Zero Trust, incluindo arquitetura Secured-core, criptografia BitLocker e proteção do Microsoft Defender, além de integração com Entra ID e Intune para gerenciamento em larga escala.

Hill explicou: “A forma como os desenvolvedores constroem software está mudando radicalmente. As capacidades e complexidade dos modelos de IA crescem, e workflows de agentes exigem computação contínua. Mesmo tarefas que não usam os modelos mais avançados podem gerar custos na nuvem a cada iteração.”

Outra novidade é o Surface Laptop Ultra, um notebook de alta performance voltado a desenvolvedores, criadores e profissionais de tecnologia, lançado anteriormente. Ambos representam o próximo passo do Surface: dispositivos dedicados a construir o futuro. O Surface RTX Spark Dev Box chegará ao mercado nos EUA ainda este ano, exclusivamente na Microsoft.com.

07 Nova plataforma para rodar agentes de IA em dispositivos, não apenas aplicativos

O chefe da equipe de ciência de aplicações da Microsoft, Stevie Bathish, apresentou o projeto interno chamado Project Solara.

Trata-se de uma nova plataforma, do chip à nuvem, baseada em Android, com o objetivo de fazer os dispositivos rodarem agentes de IA ao invés de aplicativos tradicionais. Bathish explicou: “As fronteiras estão se desintegrando. Você não precisa mais de um modo tradicional de aplicativos. Não precisa mais de formas tradicionais de desenvolver experiências.”

Na Build, foram exibidos dois dispositivos conceito:

Um centro de desktop, colocado ao lado do PC, que responde a comandos de voz, faz login por reconhecimento facial e exibe as tarefas mais urgentes do dia. Quando conectado a um monitor, pode se transformar em uma máquina Windows completa rodando na nuvem.

Um crachá vestível, uma reinvenção do cartão de identificação de funcionário. Com um toque de dedo, o usuário pode ativar o agente por impressão digital, gravar e transcrever diálogos, e a câmera embutida permite que o agente aja com base no que o usuário vê.

No demo de saúde, esse crachá executou um agente criado para profissionais de saúde, capaz de escanear QR codes de pacientes, registrar e transcrever consultas, monitorar sinais vitais e emitir prescrições. Em outro cenário, a câmera escaneou um quadro de brainstorming com ideias para reformas de escritórios e sugeriu a adição de plantas verdes.

Bathish afirmou que a Microsoft não produzirá esses dispositivos, mas imagina que fabricantes de hardware e parceiros de setor transformarão esses designs de referência em seus próprios produtos, cada um voltado a setores, empresas ou cenários específicos.

08 Chips quânticos de última geração, confiabilidade aumentada mil vezes

A Microsoft lançou o próxima geração de chips quânticos topológicos, o Majorana 2.

Em comparação com o anterior Majorana 1, a principal mudança foi a substituição do material supercondutor de alumínio por chumbo, o que elevou a confiabilidade dos qubits em 1000 vezes, com uma vida útil média de 20 segundos, chegando a alguns exemplos com um minuto de duração.

Outros tipos de qubits geralmente têm vida útil de poucos microssegundos. Com esse avanço, a Microsoft estima que o tempo para construir computadores quânticos escaláveis seja reduzido pela metade, prevendo alcançar esse marco até 2029.

O desenvolvimento do chip foi totalmente conduzido na plataforma Agentic AI do Microsoft Discovery. Os agentes gerenciaram a fabricação, medições automáticas do estado quântico e análises de dados multidisciplinares, comprimindo ciclos de medição que levavam semanas em poucos minutos, além de identificar correlações difíceis de perceber por humanos, usando dados acumulados ao longo de quase duas décadas.

Chetan Nayak, acadêmico da Microsoft, afirmou: “Agentic AI está quase em tudo que fazemos.” Mas destacou que a IA fornece apenas orientação: “é sempre o cientista que está no ciclo de decisão.”

A plataforma Microsoft Discovery também foi lançada oficialmente nesta conferência, sendo uma plataforma organizacional voltada à pesquisa de ponta, permitindo que pesquisadores implantem equipes de agentes autônomos orientados por humanos para gerar hipóteses, otimizar experimentos e validar teorias. A Microsoft também disponibilizou uma prévia do aplicativo Microsoft Discovery, que pode ser baixada gratuitamente por indivíduos, usando uma conta do GitHub Copilot, para execução local.

Contribuição especial de Jin Lu na tradução.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado