Elon Musk: Se espera que el modelo base Grok V9-Medium (1.5T) se lance oficialmente en 2 a 3 semanas

Según la monitorización de Beating, Musk indicó que el modelo base Grok V9-Medium (1.5T) ha completado su entrenamiento. Los resultados de la evaluación son buenos. Se ha añadido una gran cantidad de datos Cursor en el entrenamiento adicional, y se continuará agregando en el futuro. El trabajo de ajuste fino está en curso, y el aprendizaje reforzado comenzará en unos días. Se espera que se lance oficialmente en 2 a 3 semanas. En comparación con el modelo V8-Small de 0.5T que actualmente maneja todo el tráfico de producción de Grok, esto será una mejora significativa, especialmente en tareas complejas de codificación.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 9
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
MintedAtDawn
· hace2h
xAI esta vez va más rápido de lo que imaginaba, la guerra de modelos a fin de año será interesante
Ver originalResponder0
YieldSpring
· hace2h
¿La percepción de un aumento de parámetros de 0.5T a 1.5T, triplicando, será muy fuerte?
Ver originalResponder0
GateUser-78b4adc8
· hace9h
1.5T de parámetros, finalmente se atrevieron a invertir en componentes
Ver originalResponder0
AirdropMileCounter
· hace9h
V8-Small ha estado generando tráfico durante tanto tiempo, trabajo duro confirmado
Ver originalResponder0
GateUser-6bc62511
· hace9h
Las tareas de codificación complejas son el enfoque principal, GitHub Copilot es peligroso
Ver originalResponder0
AirdropCheck-InOfficer
· hace9h
La capacitación adicional todavía está agregando datos, esta velocidad de iteración es demasiado competitiva.
Ver originalResponder0
SlothSignal
· hace9h
Después de iniciar el aprendizaje por refuerzo, parece que volverá a inundar las pantallas con varios benchmarks
Ver originalResponder0
GateUser-03ce08c7
· hace9h
¿2-3 semanas? La velocidad del tiempo de Elon no es la misma que la de la Tierra, ¿verdad?
Ver originalResponder0
AlphaAfterTea
· hace9h
Los datos de Cursor se alimentan, la capacidad de código debe despegar.
Ver originalResponder0
Ver más
  • Fijado