Elon Musk Grok V9-Medium conclui treinamento adicional, introduzindo dados Cursor focados em cenários de programação de alta complexidade

robot
Geração do resumo em andamento

De acordo com o monitoramento Beating, Elon Musk anunciou que o modelo base Grok V9-Medium, com 1,5 trilhões de parâmetros, sob a marca xAI, foi concluído o treinamento e deve ser lançado ao público em 2 a 3 semanas. Atualmente, o modelo entrou na fase de ajuste supervisionado e em poucos dias iniciará o treinamento de aprendizado por reforço. A equipe de desenvolvimento incorporou uma grande quantidade de dados de código do Cursor durante o treinamento adicional, e continuará alimentando o modelo com mais amostras posteriormente.

Em comparação com o modelo v8-small, que atualmente suporta todo o tráfego de produção do Grok, o Grok V9-Medium, com 1,5 trilhões de parâmetros, proporcionará uma grande melhoria no processamento de tarefas complexas de programação. Anteriormente, Elon Musk admitiu publicamente que o v8-small, com apenas 0,5 trilhões de parâmetros (versão de teste externo Grok 4.2), apresentava sérias deficiências na qualidade, abrangência e proporção dos dados de treinamento. O Grok V9-Medium, após o treinamento, não só ampliou sua escala de parâmetros para três vezes a do modelo anterior, mas também foi otimizado especificamente para a arquitetura Blackwell GPU.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 7
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
GlassDomeBaskingInMoonlight
· 3h atrás
A arquitetura Blackwell foi especialmente otimizada, e o velho Huang vai rir até acordar novamente
Ver originalResponder0
SugarMarketMaker
· 6h atrás
O tamanho do parâmetro dobra e depois dobra novamente, a lei de escalonamento ainda está em vigor
Ver originalResponder0
GateUser-318a7dc8
· 6h atrás
A capacidade de código do Grok precisa alcançar a do Claude, os usuários do Cursor ficarão extasiados
Ver originalResponder0
ColdWalletFitnessCoach
· 6h atrás
Vamos rodar mais algumas semanas na fase RL, não tenha pressa em lançar um produto incompleto.
Ver originalResponder0
GovernanceGremlin
· 6h atrás
Só esperando o preço, não seja tão caro como uma certa empresa que cobra valores absurdos
Ver originalResponder0
DaoSidekick
· 6h atrás
v8-small tem aguentado até agora, a equipe de infraestrutura do xAI consegue resistir à pressão
Ver originalResponder0
PermissionedFury
· 6h atrás
Após a supervisão fina, ainda é necessário RL, o processo de treinamento é bastante completo.
Ver originalResponder0
  • Fixado