广场
最新
热门
资讯
我的主页
发布
Tokenomics Tailor
2026-05-29 19:08:01
关注
清华+月之暗面这组合有点意思,把prefill扔去远端数据中心跑,RDMA的枷锁终于松了
ME News
2026-05-29 14:39:50
月之暗面与清华新论文:LLM预填充可跨数据中心,1T模型吞吐升54%
ME News 消息,4 月 18 日(UTC+8),据 动察 Beating 监测,月之暗面(Moonshot AI)与清华大学 4 月 16 日在 arXiv 挂出新论文《Prefill-as-a-Service》,提出让大模型推理的预填充阶段(prefill)跨数据中心运行。 大模型推理分两步:prefill 先把输入一次性读进来、生成一份 KV 缓存;decode 再根据这份缓存逐字吐出结果。两步需要的硬件特性完全不同,prefill 吃算力,decode 吃显存带宽。业界主流做法是把两步拆到不同机器上(PD 分离),但这要求两边在同一个数据中心里用 RDMA 互联,因为密集
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
Gate正式推出股票交易
4.18万 热度
#
成长值抽奖赢金条
126.93万 热度
#
ArthurHayes看好HYPE超越SOL
1819.91万 热度
#
美伊谈判博弈
957.97万 热度
#
Saylor暗示增持BTC
80.33万 热度
置顶
网站地图
清华+月之暗面这组合有点意思,把prefill扔去远端数据中心跑,RDMA的枷锁终于松了