نموذج الذكاء الاصطناعي ذو البرجين من NVIDIA يُصدر كمصدر مفتوح، بسرعة توليد نص تزيد 2.42 مرة مع الحفاظ على جودة الصورة بنسبة 98.7%

ME AI أخبار: أصدرت Nvidia نموذج Nemotron-Labs-TwoTower للغة المنتشرة المنفصلة، لحل مشكلة بطء سرعة توليد الرموز في النماذج الكبيرة، وقد تم فتح الأوزان على Huggingface. يعيد هذا النموذج استخدام أوزان التدريب المسبق للشبكة الأساسية الحالية دون الحاجة إلى تدريب من الصفر، مما يقلل التكاليف بشكل كبير. يعتمد النموذج على بنية برجين مزدوجين بحجم 60 مليار معلمة، حيث يعمل شبكتان بحجم 30 مليار معلمة بالتوازي والتعاون، وتنشط كل شبكة 3 مليارات معلمة وتحتوي على 128 وحدة خبرة قابلة للتوجيه، مما يعزز كفاءة التوليد. (المصدر: MLion)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت