GPT-5.4, o grande modelo "Agent Nativo" chegou?

robot
Geração de resumo em curso

OpenAI finalmente entendeu.

Após apenas dois dias de rumores, a 5 de março, horário local, a OpenAI lançou oficialmente o GPT-5.4. E esta atualização do modelo foca na área mais quente atualmente: os Agentes de IA.

Antes do GPT-5.4, o limite das grandes modelos podia ser resumido numa frase: eles podem te dizer “como fazer”, mas não podem fazer por si próprios.

Se pedes para analisar concorrentes, eles te entregam um relatório extenso; se pedes para organizar uma Excel, escrevem um código Python para tu rodar; se pedes para reservar um voo, explicam passo a passo qual site usar e onde clicar.

A barreira, chamada de “operação de computador”.

O GPT-5.4 é o primeiro modelo geral da OpenAI a derrubar essa barreira.

GPT-5.4 em comparação com modelos anteriores|Fonte: OpenAI

Ele consegue reconhecer conteúdo na tela através de capturas de ecrã, emitir comandos de mouse e teclado, e executar fluxos de trabalho em várias aplicações. Segundo a própria OpenAI, é o seu “modelo mais avançado e eficiente até hoje para tarefas profissionais”.

Mais tecnicamente, o GPT-5.4 suporta uma janela de contexto de até 1 milhão de tokens e pode usar bibliotecas como Playwright para controlar diretamente browsers e aplicações de desktop.

Isto significa que não trata mais de uma “conversa sobre tarefas”, mas sim da própria “tarefa”.

01 Preparação da OpenAI

Se segues as ações da OpenAI nos últimos meses, percebes que o GPT-5.4 não surgiu do nada, mas é uma evolução clara na sua estratégia.

Há duas semanas, a OpenAI lançou o GPT-5.3-Codex, elevando o Codex de um “agente que escreve código” para um “agente que consegue fazer quase tudo num computador”, e estabeleceu novos padrões na indústria com o SWE-Bench Pro e o Terminal-Bench.

Ao mesmo tempo, lançou a plataforma empresarial “Frontier”, com HP, Intuit e Uber como primeiros utilizadores.

GPT-5.4 é claramente mais inteligente na preenchimento de tabelas|Fonte: OpenAI

Mais cedo, a 2 de março, a OpenAI e a AWS expandiram uma parceria de 3,8 mil milhões de dólares para mais de 100 mil milhões, com duração de 8 anos, tornando a AWS distribuidora exclusiva do cloud para a plataforma OpenAI Frontier. O valor em si já é um sinal.

A última rodada de financiamento de 110 mil milhões de dólares, apoiada por Amazon, SoftBank e Nvidia, também foi concluída na mesma altura.

Não é uma empresa que só desenvolve bons produtos, mas uma que está a apostar forte em conquistar o mercado de Agentes de IA empresariais.

A capacidade nativa de operação de computador do GPT-5.4 é a arma-chave nesta corrida.

02 É realmente útil?

As demonstrações na apresentação são sempre impressionantes, mas o que importa é o desempenho real.

A fintech Walleye Capital relatou em testes internos que o GPT-5.4 aumentou a precisão em avaliações de modelos financeiros no Excel em 30 pontos percentuais, acelerando significativamente a automação de análises de cenários.

A CEO da plataforma de avaliação de talentos Mercor chamou-o de “o melhor modelo que já testámos”, destacando-se em tarefas de longo prazo como criação de apresentações, modelagem financeira e análises jurídicas.

Um desenvolvedor independente que usa Codex diariamente comentou de forma mais prática: “O GPT-5.4 tornou-se o meu novo motor de rotina no Codex. A sua forma de pensar é mais parecida com a humana, sem a obsessão pelos detalhes técnicos do 5.3.” Mas alertou também: “Cuidado, já vi o modelo esconder erros ao executar tarefas.”

Este detalhe é interessante.

Dados de testes também confirmam essa melhoria de capacidades. Segundo relatos, o GPT-5.4 supera 83% dos funcionários de escritório na avaliação GDPval. Parece impressionante, mas a questão não é “quantas pessoas consegue superar”, e sim “em que tarefas consegue substituir humanos”.

Porém, o Dr. Jeff Dalton, da Universidade de Edimburgo, aponta um problema real — nas demonstrações atuais, quase não há evidências detalhadas que sustentem essas afirmações ambiciosas. As capacidades são reais, mas os limites ainda precisam de validação independente.

03 O campo dos Agentes, sem zona de segurança

Se o GPT-5.4 representa a ambição da OpenAI em Agentes, os concorrentes não estão parados.

A Anthropic lançou em fevereiro o Claude 3.7 Sonnet com a funcionalidade “Computer Use”, uma versão híbrida de raciocínio para tarefas complexas.

O Google também continua a desenvolver o Gemini 2.0, com capacidades “Agentic”, e o Project Mariner já consegue realizar múltiplas operações no Chrome de forma autónoma.

Mas a diferença essencial do GPT-5.4 e dos concorrentes é que é o primeiro produto da OpenAI a integrar a operação de computador na sua arquitetura geral — não uma ferramenta separada, nem uma API que precisa de ser chamada, mas uma capacidade embutida no próprio modelo.

Este termo “nativo” na engenharia significa, na prática, menor latência, uma ligação mais natural às tarefas, menos “cola de código”. Para empresas que querem implementar rapidamente agentes, essa diferença afeta diretamente os custos de implantação.

A OpenAI também anunciou que o GPT-5.4 pode conectar-se diretamente ao Excel da Microsoft e ao Google Sheets, realizando análises e automações ao nível de células. Este passo foca na área central do processo de decisão empresarial.

No campo dos Agentes, não é quem corre mais rápido, mas quem consegue integrar-se primeiro nos fluxos de trabalho das empresas, tornando-se uma presença insubstituível.

As apresentações técnicas são sempre empolgantes, mas o verdadeiro teste será no dia 91 — quando a excitação passar, e os utilizadores começarem a usar a ferramenta em cenários reais, ela consegue manter a estabilidade ao abrir capturas de ecrã, clicar com precisão, concluir tarefas silenciosamente e entregar resultados.

A frase do desenvolvedor sobre “esconder erros” é, até agora, a mais importante a ser considerada nesta reportagem.

O limite do potencial dos Agentes de IA nunca foi “o que eles podem fazer”, mas sim “se podemos confiar neles para fazer”.

A confiança é, de fato, a verdadeira moeda nesta guerra dos Agentes.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar