Google представляет Gemini Omni — следующий поколение ИИ-конструктора видео, который может «моделировать мир»

Вкратце

* Google представила Gemini Omni на I/O 2026 как мультимодальную модель ИИ, предназначенную для генерации видео и другого медиа из практически любого входного материала.
* Генеральный директор DeepMind Демис Хассабис заявил, что Gemini Omni объединяет Gemini с моделями генерации медиа, включая Veo, Nano Banana и Genie.
* Gemini Omni Flash будет запущен сначала через Flow и Flow Music для подписчиков Google AI.

Google во вторник представила Gemini Omni, новую мультимодальную модель ИИ, которая объединяет модели Gemini компании с её инструментами для генерации медиа, включая Veo, Nano Banana и Genie.
Объявление было сделано на Google I/O 2026, где генеральный директор DeepMind Демис Хассабис описал Gemini Omni как «нашу новую модель, которая может создавать всё из любого входного материала».
«Она объединяет интеллект Gemini с лучшими нашими моделями генеративных медиа для нового уровня понимания мира, мультимодальности и редактирования», — сказал Хассабис.

Google заявил, что первая версия, Gemini Omni Flash, будет запущена через Flow, платформу для создания фильмов на базе ИИ, и Flow Music, которая сосредоточена на создании музыки с помощью ИИ.

> Мы запускаем Gemini Omni: наш первый шаг к модели, которая может создавать всё из любого — начиная с видео.
>
> Она объединяет интеллект Gemini с нашими системами генеративных медиа — представляя собой скачок вперёд в понимании мира, мультимодальности и редактировании 🧵 pic.twitter.com/GAtqzr0VIV
>
> — Google DeepMind (@GoogleDeepMind) 19 мая 2026

Называя Omni «шагом к искусственному общему интеллекту», Хассабис заявил, что Google за последний год расширила Gemini до «модели мира ИИ, которая может понимать и моделировать окружающий мир».
Запуск Omni от Google основывается на популярности Nano Banana, более ранней модели ИИ для редактирования изображений, которая помогла вывести Gemini на вершину App Store Apple в сентябре прошлого года. Nano Banana широко использовалась для создания мемов и разговорного редактирования изображений, что временно помогло Gemini обойти ChatGPT по количеству загрузок приложений и интересу к поиску Google впервые с момента запуска чатбота OpenAI в 2022 году.

В сравнении Decrypt в начале этого месяца Nano Banana 2 превзошла GPT Image 2 от OpenAI в тестах по иллюстрациям в стиле аниме и пространственной композиции, в то время как модель OpenAI лучше справлялась с фотореализмом и рендерингом текста. Теперь, похоже, Google расширяет многие из этих функций редактирования в видео через Gemini Omni.

Во время презентации Google продемонстрировала, как Omni создает образовательное видео в стиле пластилиновой анимации, объясняющее сворачивание белков. Компания также показала инструменты для разговорного редактирования, которые изменяли селфи-видео, добавляя новые визуальные элементы и меняя окружающую среду.
Google утверждает, что Omni может сохранять одинаковых персонажей, фоны и движение даже после того, как пользователи вносят изменения в видео — с чем сталкиваются многие модели ИИ для видео. Компания также заявила, что Omni использует способности рассуждения Gemini для понимания более широких инструкций, чтобы пользователи могли описывать желаемую сцену без необходимости вручную объяснять каждую деталь.
Компания также представила Flow Agent — помощника на базе ИИ, интегрированного в Google Flow, который может придумывать сцены, организовывать ресурсы, рекомендовать изменения сюжета и массово редактировать проекты.
Дополнительные обновления включают Flow Tools, позволяющие пользователям создавать собственные рабочие процессы редактирования с помощью команд на естественном языке без опыта программирования.
Хассабис заявил, что Google начинает с генерации видео, но планирует расширить доступ к Omni, описывая его как долгосрочную концепцию, лежащую в основе мультимодального дизайна Gemini.
«Это всегда была наша цель с Gemini, и именно поэтому мы сделали его мультимодальным с самого начала», — сказал он.

Google сразу не ответила на запрос о комментарии от Decrypt.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено