GPT-5.6 Teste secreto a correr desenfreadamente: ChatGPT torna-se extraordinariamente inteligente, os utilizadores dominam a prova contra Fable 5

ChatGPT utilizadores relatam colectivamente uma grande melhoria na qualidade de saída nesta semana, com tempos de resposta significativamente mais longos, desencadeando especulações fervorosas sobre o próximo modelo GPT-5.6, em testes A/B secretos pela OpenAI. Desde a geração de jogos 3D com um clique até simulações de robôs, vários desenvolvedores publicaram comparações de testes no X, alegando que "o Pro 5.5 foi silenciosamente substituído por 5.6". Diz-se que o lançamento oficial pode acontecer já a 25 de junho, mas a OpenAI mantém-se em silêncio até agora.
(Resumindo: o vice-responsável do Google Gemini, Noam Shazeer, deixou a empresa para se juntar à OpenAI)
(Informação adicional: o novo Mythos da Anthropic foi treinado com sucesso, e o Sonnet 5 será lançado ainda esta semana)

Índice deste artigo

Alternar

  • Relato coletivo de utilizadores: respostas mais lentas, qualidade drasticamente aumentada
  • Detalhes vazados emergem: aumento do Juice Value, atualização da data de corte do conhecimento
  • Silêncio da OpenAI e registros de "lançamento silencioso" anteriores
  • Por trás do impulso para lançar um novo modelo: corrida do GLM-5.2, restrições de exportação à Anthropic

Nesta semana, os utilizadores do ChatGPT de repente perceberam que a qualidade das conversas parecia diferente. Não foi uma sensação isolada de alguns, mas uma vasta quantidade de relatos de desenvolvedores, criadores e instituições de avaliação, todos apontando na mesma direção: a OpenAI pode estar a testar secretamente um novo modelo.

O desenvolvedor Anshu Chimala publicou na quinta-feira um vídeo comparativo no X, mostrando diferenças na qualidade da página de login gerada com um clique, dizendo: "Bem, bem, bem, sou aquele sortudo que teve a oportunidade de experimentar o GPT-5.6 Pro primeiro." Outro desenvolvedor, Dobroslav Radosavljevič, também postou no X que, ao usar o modelo no Codex, "parece completamente diferente do 5.5", e a seção de comentários divide-se entre os que acreditam firmemente e os que permanecem céticos.

Relato coletivo de utilizadores: respostas mais lentas, qualidade drasticamente aumentada

A característica mais evidente é o tempo. O desenvolvedor Conor Dart realizou um teste, gerando um jogo 3D com física e controlo de câmara a partir de uma única sugestão, levando mais de uma hora, enquanto o GPT-5.5 Pro normalmente leva cerca de 10 minutos. Ele comentou: "Não é perfeito, mas fazer isto com uma única sugestão é realmente impressionante."

Chetas Lua, uma figura influente na comunidade de IA, também relatou no X uma situação semelhante: ao testar um robô de simulação, o tempo de resposta aumentou para entre 20 e 40 minutos, descrevendo o ritmo como "algo que não tinha visto desde que o GPT-5.5 foi lançado". Ele afirmou ainda: "O GPT-5.6 Pro continua a superar o Fable 5 da Anthropic em testes 3D."

No entanto, nem todos os testes foram unânimes. O avaliador de benchmarks de IA, Chris, usou a mesma sugestão de construção de nave espacial para testar dois modelos: um, suspeito de ser GPT-5.6 Pro, levou 87 minutos, enquanto o GPT-5.5 Extra High levou apenas 34 minutos e 42 segundos. Ele analisou: "Como já disse antes, o GPT-5.6 é uma atualização progressiva e robusta do 5.5, não um assassino do Fable. Provavelmente terá vitórias e derrotas em alguns benchmarks, mas não será claramente superior no geral."

Detalhes vazados emergem: aumento do Juice Value, atualização da data de corte do conhecimento

À medida que a discussão se intensifica, mais informações vazadas começam a circular. O divulgador Pankaj Kumar detalhou várias mudanças nas especificações: a data de corte do conhecimento foi avançada para dezembro de 2025; a configuração de força de raciocínio, chamada de "Juice Value", supostamente aumentou de 768 para 960; a capacidade de gerar design 3D e SVG superou o Fable 5 em algumas tarefas. Embora as fontes não tenham sido confirmadas oficialmente pela OpenAI, relatos de várias contas são altamente consistentes: maior capacidade de raciocínio, interface frontal incompleta, e uma versão candidata com o codinome "Kindle-Alpha".

Leo, uma figura influente na comunidade de IA, citou mensagens anónimas e publicou que o GPT-5.6 "está atualmente a ser testado de forma discreta em algumas contas Pro, e quando os utilizadores selecionam GPT-5.5 Pro, na realidade estão a usar o 5.6", prevendo que o lançamento público será a 25 de junho (quinta-feira).

Silêncio da OpenAI e registros de "lançamento silencioso" anteriores

Esta não é a primeira vez que a OpenAI opta por uma estratégia de "lançamento sem anúncio". Ao lançar o GPT-4.5, a OpenAI também substituiu o modelo sem aviso prévio, e só confirmou a mudança após os utilizadores notarem diferenças. Essa estratégia de lançamento stealth permite à empresa recolher dados reais de uso sem atrair atenção excessiva, além de facilitar uma rápida reversão em caso de problemas, evitando crises de relações públicas.

Ao contrário da abordagem mais promocional da Anthropic para cada nova versão, o Fable 5 e o Mythos 5 tiveram cronogramas claros desde o treino até o lançamento oficial. As últimas iterações da OpenAI tendem a ser mais "fazer e depois explicar". O principal cientista Jakub Pachocki teria dito em uma reunião interna que o novo modelo é uma melhoria significativa do GPT-5.5, mas a reportagem do The Information apenas confirma isso, sem detalhes sobre testes A/B ou datas de lançamento.

Vale notar que a Decrypt enviou perguntas à OpenAI sobre este assunto, sem obter resposta até o momento.

Por trás do impulso para lançar um novo modelo: corrida do GLM-5.2, restrições de exportação à Anthropic

Se a OpenAI realmente estiver acelerando o lançamento de uma nova geração de modelos de topo, há uma forte pressão competitiva por trás. O modelo de código aberto chinês GLM-5.2, com uma pontuação apenas 1 ponto atrás do Claude Opus 4.8 no benchmark FrontierSWE, já ultrapassou diretamente o GPT-5.5. Este indicador, que mede o desempenho de agentes de IA em tarefas complexas de várias horas, está a tornar-se um novo padrão de avaliação de capacidades reais de modelos na indústria.

Por outro lado, a Anthropic enfrenta dificuldades internas. Seus modelos principais, Mythos 5 e Fable 5, foram retirados do mercado após uma ordem de restrição de exportação emitida pelo governo dos EUA a 12 de junho, devido a uma vulnerabilidade de jailbreak controversa. Isso criou um vazio no mercado de modelos de topo, dando à OpenAI uma janela de oportunidade: se conseguir lançar o GPT-5.6 antes que a Anthropic resolva as restrições de exportação, poderá preencher essa lacuna.

Ao mesmo tempo, o Wall Street Journal reportou que a OpenAI está a avaliar planos de redução de preços para desenvolvedores e empresas, preparando-se para um duplo IPO. A intensificação da concorrência e a guerra de preços tornam a janela de lançamento do novo modelo crucial para a narrativa de mercado de capitais da OpenAI.

Independentemente das especulações fervorosas da comunidade, só a OpenAI pode confirmar a existência do GPT-5.6. Mas os traders do mercado de previsão Polymarket, claramente, não querem esperar: até ao fim de semana, o preço do contrato de previsão de lançamento do GPT-5.6, entre 22 e 28 de junho, disparou para 89%.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado