Google Ungkap Gemini Omni—Pembuat Video AI Generasi Berikutnya yang Bisa 'Mensimulasikan Dunia'

Singkatnya

* Google memperkenalkan Gemini Omni di I/O 2026 sebagai model AI multimodal yang dirancang untuk menghasilkan video dan media lain dari hampir semua input.
* CEO DeepMind Demis Hassabis mengatakan Gemini Omni menggabungkan Gemini dengan model-generasi media termasuk Veo, Nano Banana, dan Genie.
* Gemini Omni Flash akan diluncurkan terlebih dahulu melalui Flow dan Flow Music untuk pelanggan Google AI.

Google pada hari Selasa memperkenalkan Gemini Omni, sebuah model AI multimodal baru yang menggabungkan model Gemini AI perusahaan dengan alat-generasi mediumnya, termasuk Veo, Nano Banana, dan Genie.
Pengumuman ini disampaikan selama Google I/O 2026, di mana CEO DeepMind Demis Hassabis menggambarkan Gemini Omni sebagai “model baru kami yang dapat menciptakan apa saja dari input apa saja.”
“Ini menggabungkan kecerdasan Gemini dengan yang terbaik dari model media generatif kami untuk tingkat pemahaman dunia, multimodality, dan pengeditan yang baru,” kata Hassabis.

Google mengatakan rilis pertama, Gemini Omni Flash, akan diluncurkan melalui Flow, platform pembuatan film AI perusahaan, dan Flow Music, yang fokus pada penciptaan musik berbantuan AI.

> Kami meluncurkan Gemini Omni: langkah pertama kami menuju model yang dapat menciptakan apa saja dari apa saja - dimulai dengan video.
>
> Ini menggabungkan kecerdasan Gemini dengan sistem media generatif kami - mewakili loncatan maju dalam pemahaman dunia, multimodality, dan pengeditan 🧵 pic.twitter.com/GAtqzr0VIV
>
> — Google DeepMind (@GoogleDeepMind) 19 Mei 2026

Menggambarkan Omni sebagai “langkah menuju kecerdasan umum buatan,” Hassabis mengatakan Google telah menghabiskan tahun lalu memperluas Gemini menjadi “model AI dunia yang dapat memahami dan mensimulasikan dunia.”
Peluncuran Omni dari Google didasarkan pada popularitas Nano Banana, model pengeditan gambar AI perusahaan sebelumnya yang membantu mendorong Gemini ke puncak App Store Apple pada September lalu. Nano Banana menjadi sangat digunakan untuk pembuatan meme dan pengeditan gambar percakapan, secara singkat membantu Gemini mengungguli ChatGPT dalam unduhan aplikasi dan minat pencarian Google untuk pertama kalinya sejak chatbot OpenAI diluncurkan pada 2022.

Dalam perbandingan Decrypt awal bulan ini, Nano Banana 2 mengungguli GPT Image 2 dari OpenAI dalam pengujian ilustrasi anime dan komposisi spasial, sementara model OpenAI tampil lebih baik dalam fotorealisme dan rendering teks. Google kini tampaknya memperluas banyak fitur pengeditan tersebut ke video melalui Gemini Omni.

Selama presentasi, Google menunjukkan Omni yang menghasilkan video edukasi gaya claymation yang menjelaskan pelipatan protein. Perusahaan juga menampilkan alat pengeditan percakapan yang memodifikasi video selfie dengan menambahkan elemen visual baru dan mengubah lingkungan sekitarnya.
Google mengatakan Omni dapat menjaga karakter, latar belakang, dan gerakan tetap konsisten bahkan setelah pengguna melakukan perubahan pada video—sesuatu yang banyak model video AI kesulitan lakukan. Perusahaan juga mengatakan Omni menggunakan kemampuan penalaran Gemini untuk memahami instruksi yang lebih luas, sehingga pengguna dapat menggambarkan jenis adegan yang mereka inginkan tanpa harus menjelaskan setiap detail secara manual.
Perusahaan juga memperkenalkan Flow Agent, asisten AI yang terintegrasi ke dalam Google Flow yang dapat melakukan brainstorming adegan, mengatur aset, merekomendasikan perubahan plot, dan melakukan pengeditan massal proyek.
Pembaruan tambahan termasuk Flow Tools, yang memungkinkan pengguna membuat alur kerja pengeditan khusus menggunakan perintah bahasa alami tanpa pengalaman pengkodean.
Hassabis mengatakan Google memulai dengan generasi video, tetapi berencana memperluas akses ke Omni, menggambarkannya sebagai visi jangka panjang di balik desain multimodal Gemini.
“Ini selalu menjadi tujuan kami dengan Gemini, dan mengapa kami membangunnya agar bersifat multimodal sejak awal,” katanya.

Google tidak segera menanggapi permintaan komentar dari Decrypt.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan