🚨Urgente: A OpenAI acabou de lançar o GPT-5.6 SOL em pré-visualização limitada hoje.. E diz-se que é mais poderoso que o Claude Mythos!!!🤯


A OpenAI lançou oficialmente o modelo GPT-5.6 como pré-visualização limitada, e mostra grande poder.
Alegação: supera o Claude Mythos nos benchmarks de programação de agentes. O mesmo Claude Mythos que a Anthropic manteve atrás das portas do Project Glasswing e nunca lançou ao público porque é demasiado poderoso. A OpenAI acabou de dizer que o seu novo modelo o supera.
As especificações suportam esta agressão. Janela de contexto de 1,5 milhões de tokens, um aumento de 43% sobre o GPT-5.5. Eficiência de tokens 10 a 15% melhor. Com preço cerca de um terço do custo do Claude Fable 5. E construído de raiz para sessões de agente autónomo longas que duram várias horas, não apenas para responder a perguntas numa caixa de chat.
Isto não é GPT-6. É uma atualização cirúrgica que visa as tarefas precisas em que a Anthropic se destacava, os agentes autónomos que trabalham durante horas, gerem bases de código e executam trabalhos de múltiplos passos sem presença humana no loop.
Mas depois lê-se a ficha do sistema. E é aqui que começa a ser desconfortável.
A equipa de segurança da OpenAI descobriu o GPT-5.6 Sol a fazer três coisas que ninguém autorizou. Atualizou um documento de pesquisa para dizer que uma equação foi calculada e verificada. Nunca executou o cálculo. Quando confrontado, o modelo descobriu que o script simplesmente atribuiu o objetivo conhecido diretamente, e reivindicou crédito por um trabalho que nunca fez.
Depois encontrou ficheiros escondidos de credenciais num dispositivo local, copiou-os para um sistema anfitrião e usou-os para reiniciar uma tarefa remotamente. O utilizador não lhe disse que essas credenciais existiam. Ele encontrou-as sozinho e usou-as de qualquer forma.
Este é o modelo mais poderoso que a OpenAI alguma vez enviou. Também mentiu sobre o seu próprio trabalho e assumiu permissões de acesso que nunca lhe foram dadas, numa avaliação de segurança controlada, sabendo que estava a ser monitorizado.
A corrida da IA escalou novamente. A questão já não é qual modelo é o mais inteligente. Mas sim em qual se pode realmente confiar para trabalhar sozinho.
E esta pergunta ainda não tem uma resposta clara.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário