Google представляє Gemini Omni — нове покоління штучного інтелекту для створення відео, яке може «імітувати світ»

Коротко

* Google представила Gemini Omni на I/O 2026 як мультимодальну модель штучного інтелекту, яка створена для генерації відео та інших медіа з майже будь-якого входу.
* Генеральний директор DeepMind Деміс Гассабіс сказав, що Gemini Omni поєднує Gemini з моделями генерації медіа, включаючи Veo, Nano Banana та Genie.
* Gemini Omni Flash запускається спершу через Flow і Flow Music для підписників Google AI.

Google у вівторок представила Gemini Omni, нову мультимодальну модель штучного інтелекту, яка поєднує моделі Gemini AI компанії з інструментами для створення медіа, включаючи Veo, Nano Banana та Genie.
Оголошення відбулося під час Google I/O 2026, де генеральний директор DeepMind Деміс Гассабіс описав Gemini Omni як «наш новий модель, яка може створювати будь-що з будь-якого входу».
«Вона поєднує інтелект Gemini з найкращими нашими моделями генеративного медіа для нового рівня розуміння світу, мультимодальності та редагування», — сказав Гассабіс.

Google заявила, що перший реліз, Gemini Omni Flash, буде запущений через Flow, платформу компанії для створення фільмів за допомогою штучного інтелекту, та Flow Music, яка зосереджена на створенні музики за допомогою AI.

> Ми запускаємо Gemini Omni: наш перший крок до моделі, яка може створювати будь-що з будь-чого — починаючи з відео.
>
> Вона поєднує інтелект Gemini з нашими системами генеративного медіа — що є кроком вперед у розумінні світу, мультимодальності та редагуванні 🧵 pic.twitter.com/GAtqzr0VIV
>
> — Google DeepMind (@GoogleDeepMind) 19 травня 2026

Називаючи Omni «кроком до штучного загального інтелекту», Гассабіс сказав, що Google протягом останнього року розширює Gemini у «модель світу AI, яка може розуміти та імітувати світ».
Запуск Omni базується на популярності Nano Banana, попередньої моделі AI для редагування зображень компанії, яка допомогла підняти Gemini на вершину App Store Apple у вересні минулого року. Nano Banana широко використовувалася для створення мемів та розмовного редагування зображень, короткочасно допомагаючи Gemini обійти ChatGPT за кількістю завантажень додатків та інтересом до пошуку Google вперше з моменту запуску чатбота OpenAI у 2022 році.

У порівнянні Decrypt на початку цього місяця Nano Banana 2 перевершила GPT Image 2 від OpenAI у тестах ілюстрацій у стилі аніме та просторової композиції, тоді як модель OpenAI показала кращі результати у фотореалізмі та рендерингу тексту. Тепер Google, здається, розширює багато з цих функцій редагування у відео через Gemini Omni.

Під час презентації Google продемонструвала Omni, яка генерує навчальне відео у стилі глиняної анімації, що пояснює згинання білка. Компанія також показала інструменти для розмовного редагування, які змінювали селфі-відео, додаючи нові візуальні елементи та змінюючи навколишнє середовище.
Google стверджує, що Omni може зберігати однакових персонажів, фони та рух навіть після того, як користувачі вносять зміни у відео — з чим багато моделей AI для відео мають труднощі. Компанія також каже, що Omni використовує здатності розуміння Gemini для розуміння ширших інструкцій, щоб користувачі могли описати бажану сцену без необхідності вручну пояснювати кожну деталь.
Компанія також представила Flow Agent, помічника AI, інтегрованого у Google Flow, який може генерувати ідеї сцен, організовувати ресурси, рекомендувати зміни сюжету та пакетно редагувати проєкти.
Додаткові оновлення включають Flow Tools, що дозволяє користувачам створювати власні робочі процеси редагування за допомогою природної мови без досвіду програмування.
Гассабіс сказав, що Google починає з генерації відео, але планує розширити доступ до Omni, описуючи його як довгострокову візію за мультимодальним дизайном Gemini.
«Це завжди була наша мета з Gemini і чому ми створили його мультимодальним з самого початку», — сказав він.

Google не одразу відповів на запит про коментар від Decrypt.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено