Google DeepMind تفتح مصدر عائلة نماذج Gemma 4 متعددة الوسائط

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 3 أبريل (UTC+8)، قامت Google DeepMind مؤخرًا بإتاحة نموذج Gemma 4 متعدد الوسائط مفتوح المصدر ضمن عائلة النماذج. تدعم هذه السلسلة إدخالات النص والصور (وتدعم النماذج الأصغر إدخال الصوت أيضًا)، وتُخرج نصًا مولّدًا، بما في ذلك نسخ ما قبل التدريب ونُسخ الضبط المُوجَّه بالتعليمات. يمكن أن يصل حجم نافذة السياق إلى 256K رمزًا كحد أقصى، كما تدعم أكثر من 140 لغة. تعتمد النماذج بنية كثيفة (Dense) وبنية خبراء مختلطيْن (MoE)، وتتوفر بأربعة أحجام: E2B وE4B و26B A4B و31B. وتشمل قدراتها الأساسية أداءً عاليًا في الاستدلال، وتوسيع معالجة الوسائط المتعددة، وتحسينات على مستوى الجهاز، وزيادة نافذة السياق، وتعزيز قدرات الترميز والذكاء الاصطناعي المُستقل (agents)، ودعم تلميحات النظام الأصلية. وفي التفاصيل التقنية، تستخدم النماذج آلية انتباه مختلطة، حيث تعتمد الطبقات على مستوى عالمي على أزواج مفاتيح وقيم موحّدة وعلى نسبة RoPE (p-RoPE). ومن بينها، تستخدم نماذج E2B وE4B تقنية تضمين عبر كل طبقة (PLE) بحيث تكون المعاملات الفعّالة أقل من إجمالي المعاملات. بينما في نموذج 26B A4B MoE، لا يتم تفعيل سوى 3.8B من المعاملات أثناء الاستدلال، وتكون سرعة التشغيل قريبة من نموذج 4B معامل. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.07%
  • تثبيت