جوجل تطلق نموذج Gemma 4 12B مفتوح المصدر، ويمكن تشغيله محليًا على لابتوب استهلاكي بسعة 16 جيجابايت

جوجل تكشف عن فجوة في عائلة Gemma 4: نموذج جديد بـ 12 مليار معلمات يحتاج فقط إلى 16 جيجابايت من الذاكرة ليعمل محليًا على حاسوب محمول استهلاكي، مع نتائج أداء تقارب نسخة MoE الأكبر حجمًا التي تحتوي على 26 مليار معلمة.
(ملخص سابق: جوجل تطلق تطبيق الذكاء الاصطناعي الجديد Dreambeans! حول حياتك اليومية إلى "قصص كرتونية" محدودة الإصدار)
(معلومات إضافية: جوجل تركز بشكل كبير على الذكاء الاصطناعي! ألفابت توسع تمويل الأسهم إلى 85 مليار دولار، وتحصل على استثمار بقيمة مليار دولار من بوسكاش)

في 3 يونيو، أطلقت جوجل نموذج Gemma 4 12B، الذي يتطلب الحد الأدنى من الأجهزة، ولا يحتاج إلى معجل ذكاء اصطناعي بقيمة عشرين ألف دولار، فقط حاسوب بذاكرة نظام (RAM) أو بطاقة رسومات (VRAM) بسعة 16 جيجابايت ليعمل محليًا.

فجوة في عائلة Gemma 4

في أبريل من هذا العام، أطلقت جوجل أربعة نماذج من عائلة Gemma 4: E2B و E4B المصممان خصيصًا للأجهزة المحمولة، و26B MoE و31B Dense الموجهة للخوادم. هذه سلسلة منتجات تغطي من الأجهزة الخفيفة على الحافة إلى السحابة الثقيلة، لكن هناك فجوة واضحة في الوسط، فالإصدار المحمول خفيف جدًا، والإصدارات التي تتجاوز 26 مليار معلمة تتطلب مواصفات عالية، مما يجعل الخيارات على الحواسيب المحمولة المحلية قليلة جدًا.

12 مليار هو النموذج الذي وُجد لملء هذا الفراغ.

للتوضيح، فإن 26B MoE هو "نموذج خبراء مختلط"، حيث تعني MoE: أن النموذج يستدعي خبراء معينين عند الحاجة، بدلاً من تشغيل جميع المعلمات في كل استنتاج. ببساطة، هذا الهيكل يسمح للنموذج بحسابات أكثر كفاءة، حيث يتم تفعيل مجموعة فرعية فقط من المعلمات أثناء التنبؤ، ونسخة 26B تستخدم حوالي 4 مليارات معلمة لكل رمز. لكن الثمن هو أن جميع 260 مليار معلمة يجب أن تُحمّل مسبقًا في الذاكرة للحفاظ على سرعة التوجيه والاستنتاج، مما يجعل استهلاك الذاكرة قريبًا من نموذج كثيف بنفس الحجم.

أما 31B Dense فهو "نموذج كثيف"، حيث يتم استخدام جميع المعلمات في كل استنتاج بشكل تقليدي. بمعنى آخر، لا يوجد توفير، وكل استجابة تكون بأقصى جهد. بالمقارنة، فإن استهلاك الذاكرة الفعلي لنموذج Gemma 4 12B هو حوالي 8.1 جيجابايت، وهو تقريبًا نصف استهلاك نسخة 26B MoE.

وفي الوقت نفسه، تستخدم عائلة Gemma 4 ترخيص Apache 2.0 الذي تم اعتماده هذا العام، وهو ترخيص مفتوح يسمح بالاستخدام التجاري، والتعديل، وإعادة النشر، بحيث يمكن للمطورين استخدامه مباشرة في منتجاتهم دون الحاجة إلى طلب إذن بشكل فردي.

"تقريبًا بنفس القوة"

تدعي جوجل في إعلانها أن أداء Gemma 4 12B في العديد من الاختبارات الأساسية "تقريبًا بنفس القوة"، ويكاد يضاهي نسخة 26B MoE ذات الحجم الأكبر مرتين. تشمل نتائج الأداء الرسمية اختبارات GPQA Diamond (الاستنتاج العلمي لطلاب الدراسات العليا)، وMMLU Pro (المعرفة متعددة المجالات)، وDocVQA (أسئلة وأجوبة بصرية على المستندات)، وغيرها، والأرقام تقترب فعليًا من نسخة 26B.

لكن هناك بعض النقاط التي تستحق الحذر عند تقييم هذه الأرقام.

أولاً، هذه نتائج تقييم ذاتية من جوجل، ولم يتم التحقق منها بشكل مستقل من قبل طرف ثالث. النتائج تعتبر نقطة انطلاق، وليست نهاية المطاف، وقد تختلف النتائج في سيناريوهات الاستخدام الفعلية بشكل أكبر أو أقل مما تظهره الأرقام. ثانيًا، أن "تشغيله بـ 16 جيجابايت" صحيح من الناحية التقنية، لكن الاستهلاك الفعلي للذاكرة هو حوالي 8.1 جيجابايت، مما يجعل المساحة المتبقية على حاسوب محمول يستخدم عادة تصفح الإنترنت وبرامج تحرير النصوص ضيقة، وليس كل شخص يمكنه تشغيله بسهولة.

كما أن نموذج Gemma 4 12B هو نموذج متعدد الوسائط، يستخدم بنية موحدة بدون مشفر، مما يعني أن النموذج نفسه يمكنه معالجة النصوص والصور والصوت والفيديو مباشرة، دون الحاجة إلى مكونات ترميز إضافية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت