NVIDIAのツインタワーAIモデルがオープンソースで公開、テキスト生成速度が2.42倍向上、画質は98.7%を維持

ME AI ニュース、NVIDIAはNemotron-Labs-TwoTower離散拡散言語モデルを発表し、大規模モデルのトークン単位の生成速度が遅いという課題を解決しました。重みはHuggingfaceでオープンソース化されています。このモデルは既存のバックボーンネットワークの事前学習済み重みを再利用し、ゼロから学習する必要がなく、コストを大幅に削減します。60Bのデュアルタワーアーキテクチャを採用し、2つの30Bネットワークが並行して連携し、各タワーは3Bのパラメータを活性化し、128のルーティング可能なエキスパートモジュールを搭載することで、生成効率を向上させます。(出典:MLion)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め