Avaliação independente mostra que o MiniMax M2.7 é comparável aos modelos de ponta de código fechado em tarefas de inteligência central

robot
Geração de resumo em curso

Notícia da ME, mensagem em 5 de abril (UTC+8). Recentemente, de acordo com uma avaliação independente da LangChain, o modelo de pesos abertos MiniMax M2.7 atingiu um nível equivalente ao dos modelos de ponta de código fechado em tarefas centrais de agentes inteligentes, como operações em ficheiros, chamadas de ferramentas e cumprimento de instruções. O artigo afirma que a sua vantagem reside em reduzir significativamente os custos, cerca de 20 vezes, e aumentar a velocidade em 2 a 4 vezes. Por exemplo, considerando uma produção diária de 10 milhões de tokens, o custo de utilizar o Opus 4.6 é de cerca de 250 dólares por dia, enquanto o MiniMax M2.7 custa apenas cerca de 12 dólares por dia. Este avanço é atribuído ao impulso de benchmarks abertos como o SWE-Rebench e o Terminal Bench 2.0, tornando os modelos abertos uma opção viável para implementar agentes em ambientes de produção e podendo ser usados em conjunto com modelos de código fechado. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar