Percebi uma tendência interessante - a Meta lançou um novo modelo multimodal que literalmente destrói todas as classificações em IA. É como na classificação de criptomoedas - quando um novo ativo de repente dispara para todas as posições de liderança ao mesmo tempo.



O modelo mostrou números sérios: 89,5% no GPQA Diamond, 80,4% no MMMU-Pro, 77,4% no SWE-Bench Verified. Além disso, uma série de outros testes - Análise Artificial (52%), HLE (42,8%), ARC-AGI-2 (42,5%), SWE-Bench Pro (52,4%). Na prática, está no topo em todos os lugares.

Este é claramente um sinal de que a Meta voltou a sério ao jogo no campo das tecnologias de IA. Por muito tempo parecia que a empresa estava ficando para trás, mas agora os resultados falam por si. Quando se vê esses indicadores em todos os frentes ao mesmo tempo - não é uma coincidência, é o resultado de um trabalho sério.

É curioso observar como as classificações de criptomoedas estão constantemente mudando, assim como no mundo dos modelos de IA ocorre uma corrida própria. Parece que a competição nesta área só vai aumentar, e cada jogador tenta conquistar seu espaço.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar