広場
最新
注目
ニュース
プロフィール
ポスト
Don’tLetTheLiquidationAlarm
2026-05-29 11:03:02
フォロー
この度のXiaomiのオープンソースであるControlFoleyはかなり誠意が感じられる。
時空のデカップリングと制御可能な生成、音と映像の同期に関しては、痛点をしっかり把握していると言える。
原文表示
BlockBeatNews
2026-05-29 10:54:42
Xiaomiがオープンソースの動画ナレーションモデルControlFoleyを公開、声の調整は個人の自由に任せられる
Beating監測下、小米チームはオープンソースの動画音響フレームワークControlFoleyを開発し、可制御性を強調:映像、テキスト、または参照音声に基づいて音を生成し、声のスタイルを変更しながら音と映像の同期を維持できる。基盤にはCAV-MAEを改良した時空間音声映像符号化器を採用し、時間と音色のデカップリングを実現。マルチタスク評価はオープンソースのSOTAに達し、Kling-Foleyとの比較でも競争力を持つが、Kling-Audio-EvalやMovieGen-Audio-Benchの一部KL指標ではまだ差がある。プロジェクトは技術レポート、コード、重み、デモを公開済み。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
MyGateTradeStory
41.27K 人気度
#
USMayCPIHitsThreeYearHigh
314.08K 人気度
#
IsraelStrikesIranBTCPlunges
57.21K 人気度
#
USIranConflictEscalates
693.51K 人気度
#
GateLaunchesHongKongStockTrading
786.87K 人気度
ピン留め
サイトマップ
この度のXiaomiのオープンソースであるControlFoleyはかなり誠意が感じられる。
時空のデカップリングと制御可能な生成、音と映像の同期に関しては、痛点をしっかり把握していると言える。