Tether AI 宣布将在 QVAC SDK 0.12.0 中集成开源 TurboQuant 实现。TurboQuant 最初由 Google Research 提出,可将大模型运行过程中所需的 KV Cache 内存压缩最高 5 倍,从而支持更长上下文、更大文档及更长时间对话在本地设备运行。Tether 表示,该技术将适用于笔记本电脑、手机、边缘设备及去中心化 AI 网络,并作为其推动本地化与去中心化 AI 战略的一部分。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论
  • 置顶