GPT-5.4 núcleo revela spoilers explosivos! Pode possuir memória permanente, corrida de raciocínio extremo

Se acha que o mundo da IA está um pouco silencioso recentemente, demasiado monótono, pode ser apenas a calma antes da tempestade.

Segundo várias fontes, o GPT-5.4 já está quase a chegar!

No LMArena, já apareceu a presença do GPT-5.4.

Há pouco, a publicação estrangeira The Information revelou muitos detalhes internos sobre o GPT-5.4.

As notícias são bastante bombásticas: tem um contexto mais longo, modelos de raciocínio mais extremos e, até, pode surgir memória permanente!

Se as informações forem verdadeiras, como se diz, esta geração de modelos não será apenas uma atualização simples, mas um salto enorme na capacidade de funcionamento.

Teste antecipado do GPT-5.4, código revelado

Recentemente, o GPT-5.4 tem sido divulgado por toda parte.

Desde logs de erro do Codex, PR no GitHub, até capturas de tela enviadas por engano por funcionários, em poucos dias, o GPT-5.4 foi "revelado" pelo menos três vezes.

E tudo isso foi vazado acidentalmente pela própria OpenAI.

Primeiro, o desenvolvedor Corey Noles, ao usar o OpenAI Codex, ativou uma restrição de segurança de rede, e nos logs de erro do sistema apareceu uma sequência muito longa de nomes de modelos:

O mais importante dessa sequência é as três primeiras letras — gpt-5.4.

Resumindo, essa string pode ser considerada um ID interno de implantação da OpenAI, que traduzido significa "uma versão de teste do GPT-5.4 em implantação real."

Depois, no repositório oficial do Codex na OpenAI, surgiram dois Pull Requests:

Um dizia:

Outro foi ainda mais direto:

Parece que a OpenAI adicionou um botão de "Modo Rápido" ao GPT-5.4. Algumas horas depois, esses dois PRs foram forçados a serem removidos por push forçado.

Depois, uma cena mais dramática aconteceu: um funcionário da equipe do Codex, Tibo, publicou uma captura de tela nas redes sociais. Nela, o seletor de modelos exibia claramente GPT-5.4.

Logo após, essa postagem foi apagada.

Depois, outro desenvolvedor relatou ter visto uma string de modelo semelhante nos logs de erro do Codex.

Isso indica que o GPT-5.4 já está implantado em servidores internos, realizando testes reais de A/B.

Um comando, gerar 6000 linhas de código?

Além disso, já há relatos de uma mudança evidente — na velocidade!

Alguns testadores afirmam que a inferência do modelo está significativamente mais rápida, a geração de código mais longa, e até, uma única solicitação pode gerar mais de 6000 linhas de código!

Isso era quase impossível antes.

Algumas pessoas também descobriram uma nova funcionalidade — o Modo Rápido.

Isso pode significar que a OpenAI está experimentando novas arquiteturas de inferência, como pipelines de latência em múltiplos níveis, ou modelos com diferentes velocidades.

Além disso, foi descoberto um novo recurso na interface do modelo: alguns usuários relataram que, ao lado do resumo de raciocínio (Chain-of-Thought summary), aparecem botões de curtir ou descurtir, o que pode indicar que a conta já foi atribuída ao teste do GPT-5.4.

Modo de raciocínio extremo, desempenho explosivo

A revelação do The Information também confirma essas informações.

O destaque dessa divulgação é o modo de raciocínio extremo — Extreme Reasoning Mode.

Modelos tradicionais têm tempos de raciocínio limitados, mas esse modo extremo leva o desempenho do modelo ao máximo, permitindo gastar mais tempo e usar mais recursos computacionais para raciocínios mais profundos em problemas difíceis.

Curiosamente, segundo investigações, muitos usuários comuns do ChatGPT não demonstram grande interesse na função de raciocínio.

E, do ponto de vista comercial, essa funcionalidade também não é muito útil, pois as empresas querem respostas rápidas da IA.

Por isso, a OpenAI continua valorizando bastante a capacidade de raciocínio, o que parece ser uma motivação mais pura.

No entanto, essa notícia é uma grande vantagem para o campo de pesquisa e alguns clientes empresariais.

Claramente, na pesquisa científica, muitos usuários estão dispostos a deixar um modelo rodar por horas ou até dias em questões valiosas.

Ao mesmo tempo, algumas empresas precisarão da maior capacidade de raciocínio do GPT-5.4 e de desempenho em tarefas de longo prazo para construir agentes de IA capazes de automatizar processos mais complexos.

Segundo várias fontes, esse modo de raciocínio extremo será muito intenso, aumentando ainda mais as expectativas.

Contexto dobrado, chegando a 1 milhão de tokens

Para o GPT-5.4, essa é mais uma atualização bastante robusta — a janela de contexto passou de 400 mil tokens para um milhão de tokens.

Assim, a janela de contexto do GPT-5.4 será mais do que o dobro da atual GPT-5.2. (Claro, alguns modelos da OpenAI suportam 1 milhão de tokens, como o GPT-4.1, mas o GPT-5.2 não suporta)

Agora, o GPT-5.4 pode inserir dezenas de milhares de páginas de documentos, analisar um livro inteiro ou um grande repositório de código e dados.

Isso também coloca esse modelo na mesma linha do Gemini do Google e do Claude da Anthropic, que já suportam 1 milhão de tokens.

Afinal, outras empresas já atingiram a janela de contexto de 1 milhão de tokens, e o GPT-5.4 finalmente preenche essa lacuna.

E há rumores ainda mais exagerados do que o The Information: a janela de contexto atingiu 2 milhões de tokens!

GPT-5.4, agora especialista em "tarefas longas"

Outro ponto revelado é que o GPT-5.4 também apresenta melhor desempenho em tarefas que exigem horas de execução contínua.

Ou seja, ele consegue lembrar com mais precisão os detalhes do pedido do usuário ao longo de várias etapas, além de respeitar melhor o que pode ou não fazer, e cometer menos erros.

Claramente, isso será muito útil para o Codex, que usa IA para automatizar tarefas complexas de longo prazo.

Além disso, essa capacidade de tarefas prolongadas é fundamental para agentes de IA.

Eles podem ler requisitos, pesquisar informações, escrever código, corrigir bugs, tudo sem precisar de intervenção humana a cada passo.

GPT-5.4, pode ter memória permanente?

E vem aí a notícia mais louca — o GPT-5.4 pode ter memória permanente!

Um engenheiro postou essa revelação no X, causando um grande impacto na comunidade de IA, e o investidor de Silicon Valley, Garry Tan, rapidamente compartilhou.

Na postagem, o divulgador explica o "estado duradouro" do GPT-5.4.

Jeff Dean, ao participar do podcast latentspacepod, mencionou isso, mostrando que os principais laboratórios de IA já estão pensando nesse caminho.

Algumas especulações indicam que a OpenAI já descobriu como integrar de forma eficiente e em grande escala o modelo de espaço de estado (SSM) com o Transformer.

O segredo está na própria arquitetura do SSM, que calcula e transmite o estado oculto de forma contínua em cada passo, com complexidade linear, ao contrário do crescimento quadrático do Transformer com o comprimento do contexto.

Isso também reforça um rumor: o GPT-5.4 pode suportar uma janela de contexto de 2 milhões de tokens.

A ideia de estado persistente significa que o IA passaria de depender apenas de memória de curto prazo, como no filme "Memórias de um Gigante" (Memory Fragment), para ter uma memória estável e duradoura, como no filme "Rain Man".

Em outras palavras, daria ao modelo uma verdadeira capacidade de memória de longo prazo.

Se isso for possível, será uma revolução tecnológica enorme!

Pressão crescente, OpenAI forçada a "atualizações mensais"

Claramente, após o GPT-5, a OpenAI mudou de estratégia, passando a lançar atualizações com maior frequência mensal.

Este ano, já tivemos o GPT-5.1, GPT-5.2, e o GPT-5.4 está quase aí, com um ritmo de atualização quase mensal.

A OpenAI parece estar sendo pressionada pelos concorrentes.

Atualmente, o ChatGPT tem 910 milhões de usuários ativos semanais, um número impressionante, mas ainda longe da meta de 1 bilhão de usuários ativos.

Google, Anthropic e outros rivais continuam avançando, especialmente em contexto longo, agentes e raciocínio.

Se o GPT-5.4 realmente tiver 1 milhão de tokens de contexto, raciocínio extremo e memória persistente, a IA provavelmente se tornará um agente inteligente de trabalho contínuo.

E, se o GPT-5.4 realmente começar a "lembrar de coisas", isso pode marcar um ponto crucial na história dos grandes modelos.

O ponto de singularidade chegou, estamos acelerando a toda velocidade. Você está preparado?

Fonte: Xinzhiyuan

Aviso de risco e isenção de responsabilidade

O mercado é arriscado, invista com cautela. Este artigo não constitui aconselhamento de investimento pessoal, nem leva em conta objetivos, situação financeira ou necessidades específicas de cada usuário. Os usuários devem avaliar se as opiniões, pontos de vista ou conclusões aqui apresentadas são compatíveis com suas circunstâncias. Invista por sua conta e risco.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado