🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
小米披露1T模型MiMo-V2-Pro的训练细节:使用数千个GPU,无职位等级或截止日期
根据东查贝廷的监测,小米大模型团队负责人罗福丽在她的首次深度访谈中披露,MiMo-V2-Pro模型基础具有总参数量为1T,采用数千个GPU进行训练。她认为,1T的规模是实现接近Claude Opus 4.6性能并进入下一阶段智能体竞争的基础线。在技术层面,Pro版本将全局注意力与滑动窗口注意力的比例推向极端稀疏比例7:1,控制长文本推理成本的同时扩大参数数量,并继续使用MTP (多Token预测)架构,利用过剩的计算能力加速推理。在管理方面,百人规模的MiMo团队中,只有大约30到40人直接参与核心迭代,没有明确的职位等级、清晰的团队划分或交付截止日期。当遇到训练损失突变等不稳定的数值问题时,团队选择暂停训练进行排查,即使意味着暂停一到两周,且会产生数百万的计算成本。