IBMは量子プロセッサを使用してAIモデルを高速化 - ForkLog:暗号通貨、AI、シンギュラリティ、未来

img-1de634c92a284eee-5319827228215033# IBMは量子プロセッサを用いてAIモデルを高速化

Multiverse Computingの研究者たちは、IBMの装置上で大規模言語モデルの量子改善を発表した。これは156キュービットのHeronプロセッサを用いたハイブリッド方式のことを指す。

著者らはこの実験を、超伝導プロセッサ上での自己回帰型テキスト生成のためのLLMにおける「完全な量子改善」と最初に呼んだ。

テストにはMetaのLlama 3.1 8Bを使用した。基本モデルは追加学習せず、「凍結」させたパラメータに量子アダプターであるCayleyパラメータ化ユニタリーアダプター(CUA)を追加した。最初は従来の方法で訓練し、その後ハイブリッドな量子-古典的方式に接続した。

実験はIBM Quantum System Two上で行われた—ハイブリッド量子システム用のアーキテクチャだ。156キュービットのHeronチップを使用した。

ハイブリッドバージョンはLlama 3.1 8Bのパープレキシティを1.4%低減させた。これには約6000のパラメータを追加した—モデルのサイズの約0.000075%。

デモンストレーションでは、量子改善されたLlamaが天文学や生物学に関する質問に正しく回答し、基本バージョンでは対応できなかった(例えば、すべての巨大惑星にリングがあるかどうかなど)。

研究の主著者であるボルヒ・アイスプルアによると、この作業はコンセプトの証明だという。量子ブロックにより、最小限の計算資源で次のトークンをより正確に予測できるようになった。

チームは、完全に古典的なアプローチと比較して、より少ないパラメータ数でパープレキシティの低減と精度向上を実現することを目指している。

ちなみに、5月には米国商務省の発表後、量子企業の株価が上昇し、CHIPS R&Dプログラムの一環として米企業に20億ドルの資金が提供された。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし