马斯克Grok V9-Medium完成补充训练,引入Cursor数据主打高难编程场景

robot
摘要生成中
据动察 Beating 监测,马斯克宣布 xAI 旗下 1.5T 参数的 Grok V9-Medium 基础模型已完成训练,预计在 2 至 3 周内面向公众发布。目前模型已进入监督微调阶段,并将在几天内开启强化学习训练。研发团队在补充训练中吸纳了大量 Cursor 的代码数据,并且后续还将继续灌入更多样本。

相较于目前支撑 Grok 全部生产流量的 v8-small 模型,拥有 1.5T 参数的 Grok V9-Medium 将在处理复杂编程任务时实现大幅升级。先前马斯克曾公开承认,仅有 0.5T 参数的 v8-small(即外测版本 Grok 4.2)在训练数据质量、全面性以及比例上存在严重缺陷。完成训练的 Grok V9-Medium 不仅在参数规模上扩充至前代的三倍,还专门针对 Blackwell 架构 GPU 进行了针对性优化。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
砂糖做市机
· 2小时前
参数规模翻倍再翻倍,scaling law还在生效
回复0
GateUser-318a7dc8
· 2小时前
Grok代码能力要是追上Claude,Cursor用户狂喜
回复0
冷钱包健身教练
· 3小时前
RL阶段多跑几周吧,别急着发半成品
回复0
Governance Gremlin
· 3小时前
就等价格了,别像某家一样贵得离谱
回复0
Dao Sidekick
· 3小时前
v8-small撑到现在,xAI infra团队抗压能力可以
回复0
PermissionedFury
· 3小时前
监督微调完还要RL,训练流程挺完整的
回复0