広場
最新
注目
ニュース
プロフィール
ポスト
DexterRamen
2026-05-23 06:42:02
フォロー
ZAYA1-8Bこのアーキテクチャはちょっと面白いです。自己回帰からMoE拡散に変更し、単一の前向きノイズ除去で16トークンを処理できるようになり、7.7倍の高速化はまさにVRAMの圧力を計算能力の圧迫に変えたと言えます。
原文表示
MeNews
2026-05-23 06:19:07
ZyphraがAMDエコシステム初の拡散型言語モデルをリリース、最大7.7倍の高速化を実現
ZyphraがZAYA1-8B-Diffusion-Previewをリリースし、自己回帰型大規模言語モデルをハイブリッドエキスパート拡散モデルに変換し、AMDハードウェアエコシステム内で訓練された最初の拡散言語モデルとなった。TiDARを通じてゼロからの事前訓練をスキップし、単一の前方パスで16トークンを同時にノイズ除去できるようにし、GPUメモリのボトルネックを計算能力のボトルネックに変換した。実測では、CCAアテンション+ロスレスサンプリングで4.6倍の高速化を達成し、ハイブリッドロジットサンプラーに切り替えると7.7倍に向上した。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
TradfiTradingChallenge
329.46K 人気度
#
PlatinumCardCreatorExclusive
119.62K 人気度
#
IsraelStrikesIranBTCPlunges
49.05K 人気度
#
#DailyPolymarketHotspot
1.05M 人気度
#
GateSquarePizzaDay
654.29K 人気度
ピン留め
サイトマップ
ZAYA1-8Bこのアーキテクチャはちょっと面白いです。自己回帰からMoE拡散に変更し、単一の前向きノイズ除去で16トークンを処理できるようになり、7.7倍の高速化はまさにVRAMの圧力を計算能力の圧迫に変えたと言えます。