Anthropic prepara o Opus 4.7 e o Studio de IA Full-Stack—Enquanto Está Sentado em Algo Muito Mais Assustador

Em resumo

  • Anthropic está preparando o Claude Opus 4.7 e uma ferramenta de design de IA para websites e apresentações
  • Claude Mythos continua sendo o verdadeiro modelo de fronteira da Anthropic, e a empresa não o lançará publicamente.
  • A indústria ainda não consegue medir de forma confiável as melhorias em IA, tornando difícil verificar as alegações sobre os ganhos do Opus 4.7.

A Anthropic está se preparando para lançar o Claude Opus 4.7 juntamente com uma nova ferramenta de design alimentada por IA que permite aos usuários construir websites, apresentações e páginas de destino com comandos em inglês simples—uma notícia que causou uma queda nas ações da Adobe, Wix e Figma na segunda-feira, de acordo com The Information. Os produtos podem ser lançados já nesta semana, disse uma pessoa familiarizada com os planos à The Information. A ferramenta de design é voltada tanto para desenvolvedores quanto para usuários não técnicos, colocando-a em rota de colisão com startups como Gamma e o Stitch do Google. A Anthropic não respondeu ao pedido de comentário da Decrypt.

O Opus 4.7 nem é o modelo mais poderoso da Anthropic. Esse título pertence ao Claude Mythos—uma fera focada em cibersegurança que a empresa está entregando discretamente a algumas firmas de segurança enquanto mantém longe do público.  Recentemente, o Instituto de Segurança de IA do Reino Unido avaliou o Mythos Preview e descobriu que ele pode executar ataques cibernéticos sofisticados de forma autônoma a taxas que nenhum outro modelo conseguiu igualar. Tornou-se o primeiro IA a completar “The Last Ones”, uma simulação de ataque a redes corporativas com 32 etapas que normalmente leva equipes vermelhas humanas 20 horas. O Mythos conseguiu em três de cada dez tentativas, com uma média de 22 de 32 etapas—em comparação com o Opus 4.6, que alcançou 16. Isso importa além da segurança empresarial. Medir o que a IA realmente consegue fazer virou uma dor de cabeça para toda a indústria. A OpenAI recentemente chamou o principal benchmark de codificação de “contaminado”, mas os modelos continuam sendo comparados usando esses mesmos testes. Uma avaliação separada ARC-AGI-3 mostrou o Gemini com 0,37% e o GPT-5.4 atingindo 0,26%—enquanto humanos alcançaram 100%. O resultado é um cenário onde os benchmarks são contestados e ainda usados como evidência, dificultando a contextualização das alegações sobre os avanços do Opus 4.7 até que a Anthropic lance um cartão de modelo detalhado.

A relação entre Opus e Mythos é mais próxima do que a maioria imagina. A Anthropic constrói seus modelos de fronteira ajustando finamente a linha Opus—a mesma base que alimenta os produtos públicos do Claude é testada e fortalecida até se transformar em Mythos. O Opus 4.7 é a fundação que eventualmente recebe o treinamento de kung fu em cibersegurança. Além disso, os esforços da Anthropic têm se direcionado mais para o desenvolvimento/uso empresarial. O vazamento do código do Claude, o lançamento do sistema de habilidades e do protocolo MCP, o foco em IA agentic e o cuidado com benchmarks de codificação tornam isso ainda mais evidente. Embora a Anthropic não tenha anunciado oficialmente, os vazamentos reforçam a mudança mais ampla de um provedor de LLM para algo que se assemelha a um modelo de “estúdio de IA” de pilha completa, onde o Claude não apenas gera texto, mas constrói e implanta produtos completos.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar