Google、Gemini Omniを発表—「世界をシミュレート」できる次世代AIビデオ作成ツール

要約

* Googleは2026年のI/Oで、ほぼすべての入力から動画やその他のメディアを生成できるマルチモーダルAIモデルのGemini Omniを発表した。
* DeepMindのCEO Demis Hassabisは、Gemini OmniはVeo、Nano Banana、Genieを含むメディア生成モデルとGeminiを組み合わせたものだと述べた。
* Gemini Omni Flashは、Google AIのサブスクライバー向けにFlowとFlow Musicを通じて最初にリリースされる。

Googleは火曜日、新しいマルチモーダルAIモデルのGemini Omniを発表した。このモデルは、同社のGemini AIモデルとVeo、Nano Banana、Genieを含むメディア生成ツールを組み合わせたものだ。
この発表はGoogle I/O 2026の際に行われ、DeepMindのCEO Demis Hassabisは、Gemini Omniを「あらゆる入力から何でも作り出せる新しいモデル」と表現した。
「これはGeminiの知性と、私たちの生成メディアモデルの最高を融合させ、新たなレベルの世界理解、マルチモーダリティ、編集を実現します」とHassabisは述べた。

Googleは、最初のリリースであるGemini Omni Flashを、同社のAI映画制作プラットフォームFlowと、AI支援の音楽制作に焦点を当てたFlow Musicを通じて展開すると述べている。

> 私たちはGemini Omniをリリースします:何でも何かから作り出せるモデルへの第一歩です—まずは動画から。
>
> これはGeminiの知性と私たちの生成メディアシステムを融合させ、世界理解、マルチモーダリティ、編集の新たな進歩を示します🧵 pic.twitter.com/GAtqzr0VIV
>
> — Google DeepMind (@GoogleDeepMind) 2026年5月19日

Hassabisは、Omniを「人工汎用知能への一歩」と呼び、Googleは過去1年間でGeminiを「世界を理解しシミュレートできる世界モデルAI」へと拡張してきたと述べた。
GoogleのOmni展開は、Nano Bananaの人気に基づいている。Nano Bananaは、昨年9月にAppleのApp StoreでGeminiをトップに押し上げたAI画像編集モデルだ。Nano Bananaはミーム生成や会話型画像編集に広く使われ、一時的にGeminiがChatGPTのアプリダウンロード数やGoogle検索の関心を2022年のOpenAIのチャットボットのリリース以来初めて追い越すのに役立った。

今月初めの_decrypt_の比較では、Nano Banana 2はアニメイラストや空間構成のテストでOpenAIのGPT Image 2を上回ったが、OpenAIのモデルはフォトリアリズムやテキストレンダリングで優れていた。Googleは現在、多くの編集機能をGemini Omniを通じて動画に拡張しつつあるようだ。

プレゼンテーション中、GoogleはOmniが粘土アニメ風の教育動画を生成し、タンパク質の折りたたみを解説する様子を示した。同社はまた、会話型編集ツールを使ってセルフィービデオに新しいビジュアル要素を追加したり、周囲の環境を変更したりする様子も披露した。
Googleによると、Omniはユーザーが動画の内容を変更した後も、キャラクターや背景、動きの一貫性を保つことができるという。これは、多くのAI動画モデルが苦労する点だ。また、OmniはGeminiの推論能力を活用して、より広範な指示を理解できるため、ユーザーは詳細を手動で説明せずにシーンの種類を伝えることができると述べている。
さらに、GoogleはFlowに統合されたAIアシスタントのFlow Agentも紹介した。これはシーンのブレインストーミング、資産の整理、プロットの提案、バッチ編集を行える。
追加のアップデートとして、Flow Toolsも導入され、コーディング経験なしで自然言語のプロンプトを使ってカスタム編集ワークフローを作成できるようになった。
Hassabisは、Googleは動画生成から始めるが、長期的なビジョンとしてGeminiのマルチモーダル設計の一環としてOmniへのアクセス拡大を計画していると述べた。
「これが私たちのGeminiの目標であり、最初からマルチモーダルにした理由です」と彼は言った。

Googleは_decrypt_からのコメント要請には直ちに応じなかった。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め