São 2 da manhã aqui em Londres, e estou a testar o Claude Mythos.


Este modelo é verdadeiramente impressionante, e hoje é a primeira vez que "senti a AGI".
Aqui estão os meus pensamentos iniciais sobre o Mythos (o bom, o mau, o resumo geral):
O bom:
- Modelo de codificação extremamente, extremamente inteligente. Ele literalmente eliminou construções inteiras de uma só vez, algo que nunca tinha visto antes. Até agora, estou muito impressionado com a capacidade do Fable de simplesmente eliminar bases de código inteiras de uma só vez. Pode enviar prompts e saber com confiança que o Fable pode executar.
- Criatividade. Não vi mais ninguém mencionar isto. O Fable é super criativo em design, paletas de cores e UI/UX. É a primeira vez que prefiro um modelo da Anthropic ao Gemini para trabalhos de design (não tão bom quanto no código, mas uma melhoria notável no design na minha opinião).
- Estratégia. Vou usar o Fable como o meu modelo "premium" para todo o pensamento estratégico (negócios, objetivos importantes, etc.). Este modelo literalmente parece estar a falar com um génio e já descobriu coisas que eu não teria pensado sozinho.
- /loops. A forma mais poderosa de usar IA neste momento é Fable + um fluxo de trabalho autónomo (/loop, /goal, etc.). O futuro da IA é deixar estes modelos extremamente inteligentes trabalharem autonomamente durante horas a fio.
O mau:
- Custo. A desvantagem mais óbvia. 2x mais caro que o Opus 4.8 significa que, se não tiver um orçamento dedicado para IA, provavelmente não é prático usar o Fable para qualquer coisa (você atingirá limites).
- Disponibilidade. Só incluído nos planos pagos até 22 de junho; depois disso, tem que pagar pelo acesso à API. Não sou muito fã.
- Lento. O modelo parece estar a "pensar" em cada decisão para retornar a melhor saída possível. Recomendo ficar com o Opus/Sonnet para tarefas rápidas e usar o Fable apenas quando absolutamente necessário.
- Guardrails. É irritante ter prompts redirecionados para o Opus - especialmente em coisas que não são perigosas/maliciosas. Alguns dos meus prompts que deveriam ter sido concluídos pelo Fable foram redirecionados. Parece que a Anthropic precisa de refinar isso.
Resumo:
Estou a tratar o Fable como o meu modelo "premium". Ele vai lidar com todas as tarefas de alto nível, pois quero apenas a IA mais inteligente a trabalhar nos meus objetivos mais importantes.
Se estiver ao seu alcance, recomendo fortemente reservar um orçamento para IA, para ter acesso à melhor inteligência - é para onde o mundo está a caminhar.
O Fable é um grande avanço para o trabalho verdadeiramente autónomo (basta dar uma tarefa à IA e ela a completa de ponta a ponta), e embora as desvantagens sejam irritantes, muitas delas são, na minha opinião, algo esperadas.
No geral, estou impressionado, e esta coisa parece um génio no meu bolso.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado