El Grok V9-Medium de Musk ha completado el entrenamiento adicional, introduciendo datos de Cursor que se enfocan en escenarios de programación de alta dificultad

robot
Generación de resúmenes en curso

Según la monitorización de Beating, Elon Musk anunció que el modelo base Grok V9-Medium, con 1.5T de parámetros, bajo la marca xAI, ha completado su entrenamiento y se espera que esté disponible para el público en 2 a 3 semanas. Actualmente, el modelo ha entrado en la fase de ajuste supervisado y en unos días comenzará el entrenamiento de aprendizaje reforzado. El equipo de desarrollo ha incorporado una gran cantidad de datos de código de Cursor en el entrenamiento adicional, y en el futuro continuará alimentando con más muestras.

En comparación con el modelo v8-small, que actualmente soporta todo el tráfico de producción de Grok, el Grok V9-Medium con 1.5T de parámetros logrará una mejora significativa en el manejo de tareas de programación complejas. Elon Musk previamente admitió públicamente que el v8-small con 0.5T de parámetros (es decir, la versión de prueba externa Grok 4.2) tenía graves defectos en la calidad, exhaustividad y proporción de los datos de entrenamiento. El Grok V9-Medium, que ha sido entrenado, no solo ha ampliado su escala de parámetros a tres veces la de su predecesor, sino que también ha sido optimizado específicamente para la arquitectura Blackwell GPU.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
SugarMarketMaker
· hace2h
El tamaño de los parámetros se duplica y vuelve a duplicarse, la ley de escalado sigue siendo efectiva
Ver originalResponder0
GateUser-318a7dc8
· hace2h
La capacidad de código de Grok debe igualar a Claude, los usuarios de Cursor estarán encantados
Ver originalResponder0
ColdWalletFitnessCoach
· hace3h
Vamos a correr más semanas en la fase RL, no te apresures a lanzar un producto incompleto.
Ver originalResponder0
GovernanceGremlin
· hace3h
Solo falta que suba el precio, no seas tan caro como cierta compañía que cobra una barbaridad
Ver originalResponder0
DaoSidekick
· hace3h
v8-small ha aguantado hasta ahora, el equipo de infraestructura de xAI puede soportar la presión
Ver originalResponder0
PermissionedFury
· hace3h
Después de la afinación supervisada, aún se necesita RL, el proceso de entrenamiento es bastante completo.
Ver originalResponder0
  • Fijado