Elon Musk Grok V9-Medium conclui o treino adicional, introduzindo dados Cursor focados em cenários de programação de alta complexidade

robot
Geração de resumo em curso

De acordo com o monitoramento Beating, Elon Musk anunciou que o modelo base Grok V9-Medium, com 1,5T de parâmetros, sob a marca xAI, foi concluído e está previsto para ser lançado ao público em 2 a 3 semanas. Atualmente, o modelo entrou na fase de ajuste supervisionado e em poucos dias iniciará o treinamento de aprendizagem por reforço. A equipe de desenvolvimento incorporou uma grande quantidade de dados de código do Cursor durante o treinamento adicional, e continuará alimentando o modelo com mais amostras posteriormente.

Em comparação com o modelo v8-small, que atualmente suporta todo o tráfego de produção do Grok, o Grok V9-Medium, com 1,5T de parâmetros, proporcionará uma grande melhoria no processamento de tarefas de programação complexas. Elon Musk já admitiu publicamente que o v8-small, com apenas 0,5T de parâmetros (versão de teste externo Grok 4.2), apresentava sérias deficiências na qualidade, abrangência e proporção dos dados de treinamento. O Grok V9-Medium, após a conclusão do treinamento, não só aumentou o número de parâmetros para três vezes o tamanho do anterior, mas também foi otimizado especificamente para a arquitetura Blackwell GPU.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 6
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
SugarMarketMaker
· 2h atrás
O tamanho dos parâmetros duplica e depois duplica novamente, a lei de escalonamento ainda está em vigor
Ver originalResponder0
GateUser-318a7dc8
· 2h atrás
A capacidade de código do Grok precisa alcançar a do Claude, os utilizadores do Cursor ficarão extasiados
Ver originalResponder0
ColdWalletFitnessCoach
· 3h atrás
Vamos rodar mais algumas semanas na fase RL, não tenha pressa em lançar um produto incompleto.
Ver originalResponder0
GovernanceGremlin
· 3h atrás
Só falta o preço, não seja como aquela empresa que é ridiculamente caro
Ver originalResponder0
DaoSidekick
· 3h atrás
v8-small aguentou até agora, a equipe de infra xAI consegue resistir à pressão
Ver originalResponder0
PermissionedFury
· 3h atrás
Após a afinação supervisionada, ainda é necessário RL, o processo de treino é bastante completo.
Ver originalResponder0
  • Fixado