إليك الانقسام في الحوسبة AI الذي لا يقرأه الكثيرون بشكل صحيح.


تدريب النماذج الحدودية يتركز بقوة كل ربع سنة، آلاف وحدات GPU التي يجب أن تجلس في مكان واحد موصولة معًا. لكن التدريب يمثل 30% فقط من الطلب في 2026. أما الـ 70% الأخرى فهي الاستدلال، وتشغيله على سحابة عملاقة يعني الدفع مقابل بنية تحتية بنيت لصعبة المهام لأداء أسهلها.
على الشبكات الموزعة، يمكن أن يعمل نفس الاستدلال بتكلفة أقل بنسبة 45-75%، ولأي شخص يحدد ميزانية بنية تحتية للذكاء الاصطناعي، فإن هذه الفجوة هي القصة بأكملها.
التدريب يتركز بالضرورة. الاستدلال يتشظى لأن دفع هوامش AWS مقابل مهمة لا تحتاجها يصبح غير منطقي عند التوسع.
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت