زيادة سرعة بمقدار 208 مرة + توقع خلال 5 ميكروثانية، عند تشغيل KMeans على H200 وصل إلى 61% من ذروة FLOPS، هؤلاء الأشخاص في بيركلي أبدعوا في لعب Triton

شاهد النسخة الأصلية
CoinNetwork
حقق تسريعًا يصل إلى 208 أضعاف مقارنة بـ cuML، مكتبة FlashLib المفتوحة المصدر لتسريع التعلم الآلي الكلاسيكي من جامعة كاليفورنيا بيركلي وغيرها
قالت شبكة币界 إن مكتبة FlashLib مفتوحة المصدر لتسريع التعلم الآلي والتي كشف عنها OneMillion_AI تم تطويرها بواسطة فرق من بيركلي وغيرها، وتغطي 15 عملية عالية المستوى، وتستند إلى Triton وCutedsl، وتحقق تسريعًا ملحوظًا على GPU H200 في عمليات مثل KMeans وKNN، بحد أقصى 208 ضعفًا. مقارنة بـ cuML 25.10، حققت KMeans 26 ضعفًا، وKNN 19 ضعفًا، وHDBSCAN 40 ضعفًا، وTruncatedSVD 208 ضعفًا؛ ووصلت ذروة FLOPS لـ KMeans إلى 61%، وعرض النطاق الترددي لـ KNN إلى 85.2%. بالإضافة إلى ذلك، توفر FlashLib واجهة برمجة تطبيقات لتوقع الأداء خلال 5 ميكروثوانٍ، وتقدّر مدة التشغيل واستهلاك الذاكرة، والكود مفتوح المصدر على GitHub.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت