جوجل تكشف عن جيميني أومني—مُنشئ فيديو الذكاء الاصطناعي من الجيل التالي الذي يمكنه 'محاكاة العالم'

باختصار

* قدمت جوجل جيمني أومني في مؤتمر I/O 2026 كنموذج ذكاء اصطناعي متعدد الوسائط مصمم لإنشاء الفيديو ووسائط أخرى من أي مدخل تقريبًا.
* قال ديميس هاسابيس، المدير التنفيذي لشركة ديب مايند، إن جيمني أومني يدمج جيمني مع نماذج توليد الوسائط بما في ذلك فيو، نانو بانانا، وجيني.
* سيتم إطلاق جيمني أومني فلاش أولاً من خلال فلو وفلو ميوزيك لمشتركي جوجل AI.

قدمت جوجل يوم الثلاثاء جيمني أومني، وهو نموذج ذكاء اصطناعي متعدد الوسائط جديد يدمج نماذج جيمني للذكاء الاصطناعي مع أدوات توليد الوسائط الخاصة بها، بما في ذلك فيو، نانو بانانا، وجيني.
جاء الإعلان خلال مؤتمر جوجل I/O 2026، حيث وصف ديميس هاسابيس، المدير التنفيذي لشركة ديب مايند، جيمني أومني بأنه "نموذجنا الجديد الذي يمكنه إنشاء أي شيء من أي مدخل."
قال هاسابيس: "يجمع بين ذكاء جيمني وأفضل نماذج الوسائط التوليدية لدينا لمستوى جديد من فهم العالم، والتعددية الوسائط، والتحرير."

قالت جوجل إن الإصدار الأول، جيمني أومني فلاش، سيُطلق من خلال فلو، منصة صناعة الأفلام بالذكاء الاصطناعي الخاصة بالشركة، وفلو ميوزيك، التي تركز على إنشاء الموسيقى بمساعدة الذكاء الاصطناعي.

> نحن نطلق جيمني أومني: خطوتنا الأولى نحو نموذج يمكنه إنشاء أي شيء من أي شيء - بدءًا من الفيديو.
>
> يجمع بين ذكاء جيمني وأنظمتنا التوليدية للوسائط - مما يمثل قفزة للأمام في فهم العالم، والتعددية الوسائط، والتحرير 🧵 pic.twitter.com/GAtqzr0VIV
>
> — جوجل ديب مايند (@GoogleDeepMind) 19 مايو 2026

وصف هاسابيس أومني بأنه "خطوة نحو الذكاء الاصطناعي العام"، وقال إن جوجل قضت العام الماضي في توسيع جيمني ليصبح "نموذج ذكاء اصطناعي لفهم العالم ومحاكاته."
يعتمد إصدار أومني من جوجل على شعبية نانو بانانا، النموذج السابق للشركة لتحرير الصور بالذكاء الاصطناعي الذي ساعد في دفع جيمني إلى قمة متجر تطبيقات أبل في سبتمبر الماضي. أصبح نانو بانانا واسع الاستخدام لإنشاء الميمات وتحرير الصور الحواري، مما ساعد مؤقتًا جيمني على تجاوز ChatGPT في عدد التنزيلات والتفاعل مع بحث جوجل لأول مرة منذ إطلاق روبوت الدردشة الخاص بـ OpenAI في 2022.

في مقارنة Decrypt في وقت سابق من هذا الشهر، تفوقت نانو بانانا 2 على GPT Image 2 من OpenAI في اختبارات الرسوم التوضيحية للأنمي والتكوين المكاني، بينما أدت نماذج OpenAI بشكل أفضل في الواقعية التصويرية وعرض النصوص. يبدو أن جوجل الآن تعمل على توسيع العديد من تلك الميزات التحريرية إلى الفيديو عبر جيمني أومني.

خلال العرض، أظهرت جوجل أن أومني يمكنه إنشاء فيديو تعليمي بأسلوب الطين المتحرك يشرح طي البروتينات. كما عرضت أدوات تحرير حواري عدلت فيديو سيلفي بإضافة عناصر بصرية جديدة وتغيير البيئة المحيطة.
تقول جوجل إن أومني يمكنه الحفاظ على ثبات الشخصيات والخلفيات والحركة حتى بعد أن يقوم المستخدمون بإجراء تغييرات على الفيديو — وهو شيء يواجه العديد من نماذج الفيديو بالذكاء الاصطناعي صعوبة فيه. كما تقول الشركة إن أومني يستخدم قدرات التفكير لدى جيمني لفهم التعليمات الأوسع، بحيث يمكن للمستخدمين وصف نوع المشهد الذي يرغبون فيه دون الحاجة لشرح كل تفصيل يدويًا.
كما قدمت الشركة أيضًا Flow Agent، وهو مساعد ذكاء اصطناعي مدمج في جوجل فلو يمكنه التفكير في المشاهد، وتنظيم الأصول، وتقديم اقتراحات لتغييرات في الحبكة، وتحرير المشاريع دفعة واحدة.
تشمل التحديثات الإضافية أدوات فلو، التي تتيح للمستخدمين إنشاء سير عمل تحرير مخصص باستخدام أوامر باللغة الطبيعية بدون خبرة برمجية.
قال هاسابيس إن جوجل تبدأ بتوليد الفيديو، ولكنها تخطط لتوسيع الوصول إلى أومني، واصفًا إياه بأنه الرؤية طويلة المدى وراء تصميم جيمني متعدد الوسائط.
"كان هذا دائمًا هدفنا مع جيمني، ولهذا بنيناه ليكون متعدد الوسائط من البداية،" قال.

لم ترد جوجل على الفور على طلب تعليق من Decrypt.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت