ローカルで大規模モデルを動かすのにやっとクラウドの顔色を気にしなくて済むようになった、5倍圧縮で品質も維持、TurboQuantのこのオープンソースはまさにエッジデバイス開発者に銃を渡しているようだ

原文表示
MarsBitNews
Tether オープンソースの TurboQuant、ローカルAIデバイスのKVキャッシュ圧縮率は最大で5倍に達します
Tether AI は、TurboQuant の本番リリースをオープンソース化し、QVAC SDK 0.12.0 に統合することを発表しました。TurboQuant は Google Research のメモリ圧縮アルゴリズムに基づいており、AI ランタイムの KV キャッシュを最大 5 倍圧縮可能で、出力品質は非圧縮に近いです。この技術により、ノートパソコン、スマートフォン、エッジデバイスはクラウドを必要とせずに、より長い対話やより大きなファイルを処理できます。今回のリリースには、完全な定量化パイプライン、推論フレームワークアダプター、および開発ドキュメントが含まれ、コンシューマー向けハードウェア、エッジデバイス、ピアツーピアネットワーク上の開発者やスタートアップチームを対象としています。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め