英偉達雙塔 AI 模型開源發布,文字生成速度提升 2.42 倍、畫質保留 98.7%

ME AI 消息,英偉達發布Nemotron-Labs-TwoTower離散擴散語言模型,解決大模型逐token生成速度慢的痛點,權重已在Huggingface開源。該模型復用現有骨幹網預訓練權重,無需從頭訓練,顯著降低成本。採用60B雙塔架構,兩座30B網路並行協同,每塔啟動3B參數並搭載128個可路由專家模組,提升生成效率。(來源:MLion)
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆