Qwen 3.6 27B Dense模型在RTX 3090上达40 tok/s

robot
摘要生成中

AIMPACT 消息,4 月 24 日(UTC+8),2026年4月24日,用户 @sudoingX 发布初步测试结果:Qwen 3.6 27B Dense 模型在单张 RTX 3090 24GB 显卡上,以 40 tok/s 的速度通过 10/10 测试。该结果未使用量化技巧或融合内核,仅采用 llama.cpp 的 Q4_K_M 直接量化。用户还编写了一个粒子群基准测试来评估模型。(来源:InFoQ)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论