جولف إيه أو 2026 ملخص التسريبات! 🚨 كل القوة في هذا النموذج الجديد: Gemini Omni.


👉 ملخص النقاط الرئيسية:
نموذج موحد شامل (Omni): هذا نموذج متعدد الوسائط تمامًا، يحاول دمج النصوص، الصور، الفيديو، والذاكرة طويلة المدى (Teamfood)، كسر حواجز الوسائط، وإتمام الاستنتاج عبر الوسائط في نموذج واحد.
منافسة Seedance 2.0 بقوة؟ عنوان الفيديو يطرح سؤالًا جوهريًا. على الرغم من أن جوجل تمتلك بيانات هائلة من يوتيوب، إلا أن نموذج Veo 3.0 السابق لم يكن كافيًا في نماذج الفيديو التجارية (مقارنة بـ Seedance 2.0 أو 可灵 3.0 في الصين). هل ستتمكن قدرات الفيديو في Omni من الانتصار هذه المرة؟
إصدارات جديدة متزامنة: من المحتمل أن يتم إصدار Gemini 3.2 (ربما ترقية لنسخة Flash) و 3.5 (ربما ترقية لنسخة Pro).
إخراج الفيديو الأصلي: ربما لن يحتاج المستخدمون بعد الآن للتنقل، بل يمكنهم مباشرة في Gemini إخراج الفيديو بشكل أصلي.
💡 رأيي الشخصي: الأهم في I/O هذه المرة ليس ما إذا كان نموذج معين سينجح أم لا، بل خارطة طريق منتجات الذكاء الاصطناعي المستقبلية لجوجل. تريد جوجل أن تجعل Gemini مدخلًا موحدًا للذكاء الاصطناعي. لكن هذا صعب جدًا، البرمجة، الصوت في الوقت الحقيقي، فهم الفيديو، سلاسل المهام الطويلة... متطلبات مختلفة تمامًا للنموذج. هل يمكن لنموذج موحد أن يتفوق في جميع هذه المجالات في آن واحد؟ هذا تحدٍ كبير.
ننتظر مؤتمر 19، لنرى هل Omni مجرد تجربة أم هو أساس Gemini 4! 👀
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت