ME News ニュース、5月16日（UTC+8）、研究者はΔ-Memを提案しました。これは、大規模言語モデル向けに設計された効率的なオンラインメモリシステムです。このシステムは、完全なアクティベーション状態ではなく、モデルのアクティベーションの増分変化のみを保存・更新することで、メモリ使用量を大幅に削減します。実験により、Δ-Memはメモリ使用量を最大70％削減できることが示されており、モデルの出力品質もほぼ損なわれませんでした。この方法は、リソースが制限された環境で大規模言語モデルを展開・運用するのに役立ち、オンライン推論や継続学習のシナリオにおける実現可能性を高めます。（出典：AiHot）

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

12 いいね

報酬
12
11
2
共有

コメントを追加

BerryColdWallet

· 24分前

この考え方は神経ネットワークの差分バックアップのようで、変化だけを保存し全体を保存しない、賢い。

原文表示返信0

DeltaSmile

· 5時間前

出力品質は損なわれないことが最も重要であり、多くの圧縮方案は精度を犠牲にしすぎている。

原文表示返信0

PickingUpAirdropsInTheFog

· 11時間前

継続的な学習能力の向上は過小評価されており、パーソナライズドモデルにとって非常に重要です。

原文表示返信0

InvisibleMarketMaker

· 11時間前

70％のメモリ削減は確かに驚異的ですが、オンラインシナリオでの増分更新の計算コストが新たなボトルネックになることはありませんか？

原文表示返信0

ColdStartUnderTheAurora

· 11時間前

ついに誰かが真剣にLLMのメモリ壁の問題に取り組んだ、今後の展開を期待しています。

原文表示返信0

HotAirBalloonCrossingMountains

· 11時間前

疎な注意力と感覚は重ねて使用できると感じており、二重圧縮。

原文表示返信0

PettyLp

· 11時間前

オンラインメモリシステムのこの位置付けは非常に正確であり、推論段階の空白を埋めています。

原文表示返信0

CheckTheBlockchainBefore

· 11時間前

好奇心とLoRAのようなパラメータ効率的微調方法の互換性はどのようなものですか。

原文表示返信0

ProtocolPaladin

· 11時間前

この方向がオープンソースになれば、コミュニティはさまざまな工夫を楽しめる。

原文表示返信0

PerpPessimist

· 11時間前

実験に使用した評価セットは何ですか？GLUEですか、それともより複雑な推論タスクですか。

原文表示返信0

人気の話題
もっと見る
#
IntroducingGateStocks
34.5M 人気度
#
WinGoldBarsWithGrowthPoints
1.26M 人気度
#
IsraelStrikesIranBTCPlunges
51.75K 人気度
#
ArthurHayesSeesHYPEOvertakingSOL
18.19M 人気度
#
USIranNegotiationGame
9.57M 人気度

ピン留め

サイトマップ

Δ-Mem：大規模言語モデルに適した効率的なオンラインメモリ

人気の話題

IntroducingGateStocks

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

ArthurHayesSeesHYPEOvertakingSOL

USIranNegotiationGame

ピン留め