GLM-5.1 conquistou o primeiro lugar no ranking de código do LMArena e ficou em terceiro lugar mundial

robot
Geração de resumo em curso

De acordo com a monitorização do AI News 1M, hoje a plataforma de avaliação de IA de autoridade global LMArena (com milhões de utilizadores a participar em testes cegos) atualizou a lista especial do Code Arena, com o GLM-5.1 a liderar como o primeiro modelo de código aberto a nível mundial, ocupando a terceira posição entre os modelos globais.
O GLM-5.1 não só herdou a capacidade de codificação SOTA de código aberto da geração anterior, como também fez avanços em tarefas de longo prazo (Long-Horizon Task), alcançando:

  1. Construção de uma interface Linux do zero em 8 horas;
  2. Quebra do gargalo de otimização de bases de dados vetoriais com 655 iterações;
  3. Otimização de carga de modelos de aprendizagem automática reais com 1000 rodadas de chamadas de ferramentas.
    Vale destacar que, sob os mesmos critérios de avaliação da lista METR, o GLM-5.1 é o único modelo de código aberto capaz de trabalhar continuamente por 8 horas, sendo também um dos poucos modelos no mundo, além do Claude Opus 4.6, a possuir essa capacidade.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar