IBM 利用量子处理器加速了人工智能模型 - ForkLog:加密货币、人工智能、奇点、未来

img-1de634c92a284eee-5319827228215033# IBM 利用量子处理器加速了人工智能模型

Multiverse Computing 的研究人员宣布在 IBM 设备上实现了大型语言模型的量子增强。 这是一种使用 156 量子比特 Heron 处理器的混合方案。

作者将该实验称为第一个“端到端的量子增强”超导处理器上的 LLM,用于自回归文本生成。

在测试中使用了 Meta 的 Llama 3.1 8B。没有对基础模型进行微调:参数被“冻结”,并添加了量子适配器——Cayley 参数化的酉适配器(CUA)。首先用传统方法训练,然后连接到混合量子-经典方案。

该实验在 IBM Quantum System Two 上进行——一种用于混合量子系统的架构。在设备中使用了 156 量子比特的 Heron 芯片。

混合版本将 Llama 3.1 8B 的困惑度降低了 1.4%。为此添加了大约 6000 个参数——约占模型大小的 0.000075%。

在演示中,量子增强的 Llama 能正确回答天文学和生物学相关的问题,而基础版本未能解决(例如,关于所有巨行星是否都有环的问题)。

据主要研究人员 Borja Aispuro 介绍,这项工作是概念验证。量子块使得在最小计算资源消耗的情况下,更准确地预测文本中的下一个标记。

团队希望在参数更少的情况下,进一步降低困惑度并提高准确性,相较于完全经典的方法。

提醒一下,五月份在美国商务部宣布向美国公司提供 20 亿美元的 CHIPS 研发计划资金后,量子公司股价上涨。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论