Sand.aiが10億ドル超の資金調達を獲得:自己回帰型ビデオ路線を堅持し、7月にオープンソースのMoE大規模モデルをリリース予定

動察 Beating 監測によると、動画生成大規模モデル企業の Sand.ai(2024年1月設立)は、合計で1億ドルを超える2回の資金調達を完了したと発表した。投資者には Look Capital、Lollapalooza Capital(王慧文の家族運営)、九坤創投、経緯創投、和玉资本(MSA Capital)、イノベーションファクトリー、ソースコードキャピタル、IDG、百度ベンチャーキャピタルなどの一線機関が含まれる。本ラウンドの資金調達において、星涵资本が財務顧問を務めた。

Sand.aiの創設者曹越はインタビューで、チームは一貫して主流のDiffusionルートではなく、非コンセンサスと見なされる自己回帰(Autoregressive)動画生成ルートを追求していると述べた。彼らが以前公開したMagi-1モデルは、Google DeepMindのPhysics-IQ物理的真実性テストのランキングで第一位を維持している。

動画生成の「コスト、速度、効果」の不可能な三角を突破するために、Sand.aiは昨年、MoE(混合専門家)アーキテクチャの探索に転向し、2026年7月(第3四半期)に新世代のMoEアーキテクチャを採用した動画生成モデルをリリースする計画だ。このモデルは高効率な推論と、現在のオープンソース分野で最大のパラメータ規模を兼ね備え、オープンソース化も行う予定である。

商業化の面では、Sand.aiはモデルと製品の二輪駆動戦略を採用している。今年1月にリリースした音楽エージェント製品VidMuseは、わずか2か月で1000万ドルのARRを達成した。さらに、同社がオープンソース化したMagiAttention演算子ライブラリは、国内のほぼすべてのマルチモーダルモデルチームに採用され、NVIDIA公式からも推奨されている。

業界で熱議されている「世界モデル」概念について、曹越は現在もGPT-1登場前の時代にあると考えている。データとルートはまだ収束しておらず、動画は世界モデルに向かう最も重要なデータモダリティであると述べた。彼は、動画の原始観測データ(ピクセル/フレーム)を予測することでモデルが物理法則を自主的に習得すべきであり、人間の先验知識を導入して状態変数を明示的にモデル化すべきではないと指摘した。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め