ME AI ニュース、NVIDIAはNemotron-Labs-TwoTower離散拡散言語モデルを発表し、大規模モデルのトークン単位の生成速度が遅いという課題を解決しました。重みはHuggingfaceでオープンソース化されています。このモデルは既存のバックボーンネットワークの事前学習済み重みを再利用し、ゼロから学習する必要がなく、コストを大幅に削減します。60Bのデュアルタワーアーキテクチャを採用し、2つの30Bネットワークが並行して連携し、各タワーは3Bのパラメータを活性化し、128のルーティング可能なエキスパートモジュールを搭載することで、生成効率を向上させます。(出典:MLion)
NVIDIAのツインタワーAIモデルがオープンソースで公開、テキスト生成速度が2.42倍向上、画質は98.7%を維持