Unicórnio de IA do Japão lança Sakana Fugu: chamadas automáticas de múltiplos modelos podem rivalizar com Claude Mythos? Avaliação de desempenho e preço de uma só vez

Múltiplos modelos de IA trabalhando em colaboração, apresentando apenas uma API externa, Sakana AI lançou oficialmente o Sakana Fugu em 22 de junho de 2026, um sistema de modelos coordenados treinados por reforço que distribuem tarefas automaticamente para múltiplos agentes especializados.
(Resumindo: Anthropic foi "banida" pelo governo dos EUA, removendo o modelo Fable, com a mídia estrangeira apontando três principais preocupações: potencial auxílio à China na abertura de IA)
(Complemento de contexto: Elon Musk se torna um fornecedor de poder computacional! SpaceX assina um grande contrato de 6,3 bilhões de dólares com Reflection, alugando Nvidia GB300 para impulsionar IA de código aberto)

Índice deste artigo

Alternar

  • Como funciona o modelo de comandante
  • Modelos de ponta com limitações
  • Estrutura de preços e restrições de mercado

Vários modelos de IA de ponta entram em ação ao mesmo tempo, mas apenas uma API precisa ser chamada — essa é a aposta central do Sakana AI no Fugu. Nesta segunda-feira (22), o laboratório de IA japonês Sakana AI lançou oficialmente o Sakana Fugu.

Posicionado como “substituição de um único modelo por um sistema”: uma estrutura que automatiza a coordenação de múltiplos agentes especializados, expondo externamente apenas uma interface API compatível com OpenAI. Os usuários não precisam saber quantos modelos estão rodando nos bastidores nem projetar manualmente processos de colaboração; tudo é gerenciado pelo mecanismo de comando interno do Fugu.

Como funciona o modelo de comandante

A arquitetura subjacente do Fugu possui duas inovações: TRINITY e Conductor.

TRINITY foi projetado com uma estrutura de divisão triangular: a tarefa é dividida entre três papéis, “Pensador” (Thinker) responsável por planejar a solução, “Executor” (Worker) encarregado de implementar, e “Verificador” (Verifier) que busca vulnerabilidades.

Os três papéis são desempenhados por diferentes LLMs, formando um grupo de trabalho com pesos e contrapesos. Simplificando: evita que o mesmo modelo pense na solução e também revise a resposta.

Conductor é o núcleo de todo o sistema, um modelo de coordenação treinado por reforço com 7 bilhões de parâmetros, responsável por decidir quais agentes chamar para cada tarefa, como eles se comunicam e como integrar a saída final. Este modelo não depende de fluxos de trabalho pré-definidos, mas aprende a explorar os caminhos mais eficientes de colaboração, que Sakana chama de “modo de cooperação não intuitivo, mas altamente eficiente”.

O pool de agentes pode ser ajustado de forma flexível. O nível Standard permite que empresas excluam fornecedores ou modelos específicos para atender a requisitos de privacidade de dados ou conformidade, uma diferenciação crucial para organizações que não podem deixar seus dados sair do ambiente.

Modelos de ponta com limitações

Sakana utilizou quatro critérios de avaliação para comparar o desempenho do Fugu com modelos de ponta.

  • SWE Bench Pro (capacidade de correção de código de engenharia de software): Fugu 59,0 pontos, Fugu Ultra 73,7 pontos
  • LiveCodeBench (competição de programação em tempo real): Fugu 92,9, Fugu Ultra 93,2
  • GPQA Diamond (questionário interdisciplinar de nível de pós-graduação, com dificuldade próxima ao exame de qualificação de doutorado): Fugu e Fugu Ultra ambos com 95,5
  • Humanity’s Last Exam (banco de questões extremamente difíceis criado por acadêmicos de elite global): Fugu 47,2, Fugu Ultra 50,0.

Sakana afirma que esses números “estão na mesma linha de Mythos Preview e Fable 5 em testes rigorosos”, embora ainda aguardem validação por terceiros.

Estrutura de preços e restrições de mercado

Fugu possui três níveis de assinatura: Standard por US$ 20 mensais, Pro por US$ 100 mensais (10 vezes mais uso), Max por US$ 200 mensais (20 vezes mais uso), todos incluindo acesso ao Fugu e Fugu Ultra.

Além disso, há uma opção de cobrança por token para empresas, com Fugu Ultra cobrando US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída; para contextos longos com mais de 272.000 tokens, as taxas sobem para US$ 10 de entrada e US$ 45 de saída.

Um aspecto importante do modelo de cobrança: Sakana enfatiza que chamar mais agentes durante uma tarefa não significa custos proporcionais. A tarifa é baseada no nível mais alto do modelo ativo no pool de agentes, usando uma taxa de mistura única. Ou seja, adicionar um segundo ou terceiro agente não dobra a conta, oferecendo vantagem de custo em tarefas complexas em comparação à integração de múltiplas APIs.

A restrição mais clara atualmente é geográfica: Fugu não está disponível para usuários na União Europeia e no Espaço Econômico Europeu (EEE), com a justificativa oficial de que estão buscando certificação de conformidade com GDPR, sem prazo definido. Usuários que assinarem antes de julho de 2026 podem receber o segundo mês gratuito.

Executar múltiplos modelos em colaboração supera o desempenho de um único modelo, mas essa não é uma ideia nova apresentada pelo Sakana. O que eles realmente defendem é: na arquitetura de comando, cada agente pode ser substituído, e o limite do sistema não fica preso a qualquer fornecedor específico.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado