🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
分析:TileKernels开源内容与此前Yifan Zhang披露的V4架构规格多处对应
据动察 Beating 监测,DeepSeek 开源的 TileKernels 内核库与此前 Yifan Zhang 披露的 V4 架构规格存在多处对应。
Zhang 称 V4 残差连接用 Hyper-Connections。TileKernels 开源的是 mHC(Manifold-Constrained Hyper-Connections)内核,这是 DeepSeek 对字节 Seed 团队 2024 年提出的 HC 加双随机矩阵约束的改进版,解决了原始 HC 在大规模训练时的信号发散问题。mHC 本身属于 Hyper-Connections 的一种,原始 HC 无法支撑大规模稳定训练,V4 实际使用的应该就是 mHC。Zhang 称 V4 用 Fused MoE Mega-Kernel 管理 384 专家激活 6 个的 MoE 层,TileKernels 的 MoE 模块包含 Top-k 专家选择、token 到专家映射和融合的专家分发与收集。
TileKernels 还包含 Engram 的内核,这是 DeepSeek 今年 1 月论文提出的条件记忆模块,但 Zhang 的 V4 规格中没有提到 Engram。库支持 SM90(Hopper)和 SM100(Blackwell),没有华为 Ascend 支持。《The Information》此前报道 V4 在 Blackwell 上训练,DeepSeek 同时花数月将模型适配华为和寒武纪芯片。