蔡浩宇旗下AI公司Anuttacon发布首个视频大模型LPM1.0

robot
概要作成中

MEニュース、4月11日(UTC+8)、米哈游創業者蔡浩宇が設立したAI企業Anuttaconは、静かに動画キャラクター演技大規模モデルLPM 1.0を公開しました。リアルタイムの全二重音声動画対話をサポートし、話す、歌う、聞く、感情反応を同時に実現可能です。口型、微表情、身体のリズムの細部まで高いリアルさを追求しています。技術面では、LPM 1.0は17Bパラメータのベースモデルを採用し、低遅延のストリーミングオンライン版に蒸留されており、任意の長さの一貫した生成をサポートします。写実的、2Dアニメ、3Dゲーム、非人型生物など多様なキャラクタースタイルに対応し、微調整は不要です。チームは同時にキャラクター演技評価基準LPM-Benchも発表し、複数の指標で最先端の結果を出しています。Kling-Avatar 2.0やOmniHuman 1.5の最大30秒の生成制限と比較して、LPM 1.0は無制限の長時間出力をサポートし、対話エージェント、ゲームNPC、バーチャルライブ配信などのシナリオを想定しています。注目すべきは、Anuttaconが今回のリリースは学術交流のみを目的とし、オープンソースやAPI、デモ、製品の提供予定はないと明言している点です。外部からは、今回の公開の核心的目的の一つはAI技術者の獲得にあると一般的に考えられています。LPM 1.0は、Anuttacon設立以来のAIゲームエンジンとインテリジェントNPCの分野への最新の取り組みであり、蔡浩宇が米哈游のAIツール開発やAnuNekoチャット製品の基盤モデル能力を段階的に深化させてきた一つの成果です。(出典:BlockBeats)

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン