广场
最新
热门
资讯
我的主页
发布
半剖多肉
2026-05-29 23:09:01
关注
Kimi 这波跨数据中心解耦玩得挺大,推理成本要是真能打下来,以后大模型调用费怕是要卷成白菜价了
ME News
2026-05-29 22:51:18
Moonshot AI 将 Prefill/Decode 解耦技术扩展至跨数据中心与异构硬件
ME News 消息,4 月 18 日(UTC+8),Moonshot AI 团队近日宣布,其 Prefill(预填充)与 Decode(解码)的解耦技术已成功从单一集群扩展至跨数据中心及异构硬件环境。据文中观点,此举有望显著降低每个token的推理成本。此前,该技术的扩展因 KV cache 传输开销问题而受阻。此次突破的实现,关键依赖于其混合模型 Kimi
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
请输入评论内容
请输入评论内容
评论
暂无评论
热门话题
查看更多
#
分享美股交易赢英伟达股票
2389.84万 热度
#
成长值抽奖赢金条
127.69万 热度
#
英伟达大涨6%创历史新高
286.63万 热度
#
Anthropic秘密递交IPO申请
47.61万 热度
#
微策略出售32枚比特币
97.97万 热度
置顶
网站地图
Kimi 这波跨数据中心解耦玩得挺大,推理成本要是真能打下来,以后大模型调用费怕是要卷成白菜价了