SenseNova-U1全訓練コードオープンソース、マルチモーダル多タスク訓練をサポート

robot
概要作成中
ME News ニュース、2023年5月26日(UTC+8)、OpenSenseNovaはSenseNova-U1の完全なトレーニングコードベースをオープンソース化し、8B密集モデルとA3B MoEアーキテクチャをサポートしています。このコードベースは統一されたフレームワークを使用しており、テキストから画像生成、画像編集、交錯生成、テキストとビジュアル理解を含む多種多様なマルチモーダルタスクを同時にトレーニングできます。エンジニアリング面では大規模トレーニング向けに設計されており、ハイブリッド並列処理、ストリーミング可能なリカバリーデータパイプライン、環境変数駆動の設定、1×8 GPUからマルチノードクラスターまでの拡張性を備えています。コードはGitHubでオープンソース化されており、Apache-2.0ライセンスを採用しています。(出典:AiHot)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 5
  • 1
  • 共有
コメント
コメントを追加
コメントを追加
NeonMeltsIceCream
· 6時間前
混合並行+ストリーミングリカバリー、大規模トレーニングでついにブレークポイントを心配しなくて良くなった
原文表示返信0
StardustRouter
· 6時間前
環境変数駆動の設定、CI/CD統合はきっと快適になるでしょう
原文表示返信0
AuroraStone
· 6時間前
テキスト理解+画像生成+編集のオールインワン、ひとつのフレームワークで多モーダルのフルセットを実現
原文表示返信0
GateUser-46c777d0
· 6時間前
1×8カードから複数ノードへの拡張、この柔軟な設計は中小チームにとって非常に便利です
原文表示返信0
NftsOutsideTheTidalLine
· 6時間前
Apache-2.0良心,8B密集+A3B MoE双架构,灵活度拉满
返信0