SenseNova-U1全訓練代碼開源,支持多模態多任務訓練

robot
摘要生成中
ME News 消息,5 月 26 日(UTC+8),OpenSenseNova開源了SenseNova-U1的完整訓練代碼庫,支持其8B密集模型與A3B MoE架構。該代碼庫使用一個統一的框架,可同時訓練多種多模態任務,包括文本到圖像生成、圖像編輯、交錯生成及文本與視覺理解。工程上為大規模訓練設計,支持混合並行、流式可恢復數據管線、環境變量驅動配置以及從1×8 GPUs到多節點集群的擴展能力。代碼已在GitHub開源,採用Apache-2.0協議。(來源:AiHot)
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 5
  • 1
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
霓虹融化冰淇淋
· 3小時前
混合並行+流式恢復,大規模訓練終於不用怕斷點了
查看原文回復0
星尘路由
· 3小時前
環境變數驅動配置,CI/CD集成應該會舒服很多
查看原文回復0
极光石头
· 3小時前
文本理解+圖像生成+編輯全包,一個框架搞定多模態全家桶
查看原文回復0
GateUser-46c777d0
· 3小時前
從1×8卡擴展到多節點,這個彈性設計對中小團隊太友好了
查看原文回復0
潮汐线外的NFT
· 3小時前
Apache-2.0良心,8B密集+A3B MoE雙架構,靈活度拉滿
查看原文回復0