马斯克:Grok V9与V8差距巨大,V9训练版本已有更优表现

robot
摘要生成中
AIMPACT 消息,5 月 15 日(UTC+8), 马斯克在 X 平台发文表示,其最新完成的 Grok V9(1.5T 参数)训练运行"表现非常好",且该结果尚未纳入 Cursor 数据的补充训练部分。当前内部正在开发的基础模型版本为 V9,参数规模约 1.5 万亿,相较 V8 在数据清洗、训练方法、模型规模等方面均有显著提升,并针对 Blackwell 架构进行了优化,以提升算力利用效率。 马斯克强调,相比之下,当前对外版本 v4.2 基于 V8 基础模型构建,参数规模约 0.5T,运行在 Hopper 架构上,在训练数据质量与覆盖范围方面仍存在一定局限。Grok V8 与 V9 之间的性能差距巨大,新一代模型在整体能力上实现了跨越式升级。(来源:ODAILY)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 8
  • 1
  • 分享
评论
请输入评论内容
请输入评论内容
玻璃穹顶星尘
· 42 分钟前
好奇 V9 的幻觉率有没有改善,大模型不是越大越好
回复0
SudoSage
· 3小时前
跨越式升级这个词从马斯克嘴里出来,通常意味着真的有点东西
回复0
YieldKaraoke
· 4小时前
对外还在跑 Hopper,内部已经 Blackwell,信息差玩得明白
回复0
GateUser-53a6e1a8
· 5小时前
数据清洗这块终于重视了,之前 Grok 的回复质量确实忽高忽低
回复0
别喊我接盘侠
· 5小时前
Blackwell 架构优化是重点,算力利用率提升直接决定能不能盈利
回复0
青柠杠杆警报
· 5小时前
等一手 Cursor 集成,V9 这参数规模有点离谱
回复0
黑丝绒蓝牡丹
· 5小时前
Blackwell 优化说明老黄和马斯克绑得越来越紧了
回复0
雨后撤单员
· 5小时前
0.5T 到 1.5T 三倍参数,差距确实大
回复0