Anthropic finalmente lançou a versão segura do modelo Mythos, Fable-5.


As informações sobre os parâmetros já foram bastante discutidas na internet, então não vou repetir.
O que vale mais a pena ver, na verdade, são os testes reais de tarefas feitos por uma ferramenta de programação de terceiros, Augment Code.
Este conjunto de testes executou um total de 489 tarefas de programação, e os resultados são bastante interessantes:
Fable-5 lidera claramente em desempenho geral e precisão.
Pontuação geral +0.224, precisão +0.191, de fato é a categoria mais forte até agora.
Mas outro detalhe também é muito importante: GPT-5.5 ainda supera com folga o Opus-4.8.
A pontuação geral do GPT-5.5 é +0.164, enquanto a do Opus-4.8 é +0.128;
Na precisão, GPT-5.5 é +0.141, e Opus-4.8 é +0.092.
Isso também explica minha sensação recente: após o lançamento do Opus-4.8, não senti que ele fosse claramente mais forte que o GPT-5.5,
pelo menos em tarefas de programação reais, essa sensação não é uma ilusão.
O que é mais realista é a questão do custo.
Fable-5, embora forte, consome muitos tokens e tem um custo alto: cerca de 14,6 mil tokens por tarefa, custo de $3,09 por tarefa;
em comparação, GPT-5.5 usa 7,5 mil tokens e custa $1,52.
Ser forte é uma coisa, mas caro também é uma realidade.
Portanto, a última frase ainda é a mesma: espero que o GPT-5.6 chegue logo.
Se o Fable-5 só puder ser usado por 10 dias no plano de assinatura, e depois precisar ser chamado pelo preço original da API,
ele provavelmente não será uma ferramenta de produtividade diária para usuários comuns, mas sim um “modelo de luxo” para poucos e em poucos cenários.
O uso de modelos de IA pode realmente começar a dividir por classes.
Ver original
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado