Avaliação independente mostra que o MiniMax M2.7 é comparável aos modelos de ponta de código fechado em tarefas centrais de agentes inteligentes

robot
Geração de resumo em curso

ME News Notícias, 5 de abril (UTC+8), recentemente, de acordo com uma avaliação independente do LangChain, o modelo de peso aberto MiniMax M2.7 atingiu um nível comparável ao de modelos de ponta de código fechado em tarefas centrais de agentes inteligentes, como operações de arquivos, chamadas de ferramentas e seguimento de instruções. A opinião do artigo é que sua vantagem reside na redução de custos em aproximadamente 20 vezes e no aumento de velocidade de 2 a 4 vezes. Tomando como exemplo uma saída diária de 10 milhões de tokens, o custo usando Opus 4.6 é de cerca de 250 dólares por dia, enquanto o MiniMax M2.7 custa apenas cerca de 12 dólares por dia. Esse avanço foi possibilitado pelo impulso de benchmarks abertos como SWE-Rebench e Terminal Bench 2.0, tornando os modelos abertos uma opção viável para implantação de agentes inteligentes em ambientes de produção, podendo também ser utilizados em conjunto com modelos de código fechado. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar