ZyphraがAMDエコシステム初の拡散型言語モデルをリリース、最大7.7倍の高速化を実現

robot
概要作成中
AIMPACT メッセージ、5 月 15 日(UTC+8)、動察 Beating 監測によると、Zyphra は自己回帰大規模言語モデルから変換されたハイブリッドエキスパート(MoE)拡散モデル ZAYA1-8B-Diffusion-Preview を公開しました。公式は宣伝の中で「最初の」このアーキテクチャを変換したモデルと自称していますが、この路線は昨年末に SDAR や LLaDA 2.0 などのチームによって先行して実現されています。ZAYA1 の真の唯一性のタグは、AMD ハードウェアエコシステム内で訓練を完了した最初の拡散言語モデルであることにあります。 マーケティングの話を剥ぎ取ると、このモデルは依然として拡散アーキテクチャの工学的効率向上の価値を証明しています。従来の自己回帰モデルは逐字列の逐次生成に制限され、KVキャッシュの蓄積は生成速度を物理的な限界に近づけます。最近の何恺明チームの純粋拡散モデル ELF が示す業界のトレンドと同様に、並列ノイズ除去はこのボトルネックを打破する鍵です。ZAYA1 は TiDAR 方式を採用し、ゼロからの事前訓練をスキップし、単一の前向き伝播で 16 個のトークン候補のノイズ除去を同時に行うことができ、メモリ帯域のボトルネックを計算能力のボトルネックに完全に変換しました。 実測では、ZAYA1 専用の CCA 注意メカニズムと組み合わせて、標準の不可逆サンプラーを使用することで、生成品質を損なうことなく 4.6 倍の高速化を達成しています。ハイブリッドロジットサンプラーに切り替えると、加速比はさらに 7.7 倍に跳ね上がり、大規模推論タスクの高コストを実質的に削減する余地を提供しています。(出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 7
  • 2
  • 共有
コメント
コメントを追加
コメントを追加
GateUser-9008328f
· 6時間前
TiDAR が節約した事前学習コストは、いくつの下流タスクを訓練するのに十分ですか
原文表示返信0
CrystalBallForSentiment
· 6時間前
拡散型言語モデルはついにNVの顔色を気にせずに済むようになった、良いことだ
原文表示返信0
GateUser-eccf92a1
· 6時間前
TiDAR は事前学習をスキップするこの手法が非常に効率的で、AMD エコシステムにおいてついに戦える拡散モデルが登場した。
原文表示返信0
GateUser-4aa73916
· 6時間前
一回前向可以处理 16 个 token,延迟敏感场景非常高兴
原文表示返信0
Semi-MeltedIceCream
· 6時間前
CCA 注意力無損採樣 4.6倍,工程細節想蹲個技術部落格
原文表示返信0
MosaicButterfly
· 6時間前
16トークン同時デノイズ、メモリ容量を計算力に換算するこのアイデアは、コンシューマ向けカードにとって非常に親しみやすい
原文表示返信0
LookingAtTheCandlestickChart
· 6時間前
AMD 上でトレーニングを行い、移植ではなく、エコシステムの発言権が変わり始めた
原文表示返信0
  • ピン留め