أطلقت جوجل الجيل الثامن من وحدة المعالجة التوربينية (TPU)، حيث تم تقسيم تدريب الاستنتاج لأول مرة إلى شريحتين مستقلتين

robot
إنشاء الملخص قيد التقدم
أخبار ME، في 22 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察 Beating، أعلن الرئيس التنفيذي لشركة جوجل Sundar Pichai في مؤتمر Cloud Next 2026 عن الجيل الثامن من وحدات المعالجة التوريدية TPU، لأول مرة يتم فصل التدريب والاستدلال إلى شريحتين مستقلتين.
يستهدف TPU 8t التدريب. يمكن لعنصر خادم فائق واحد أن يتصل بـ 9600 وحدة TPU، ويوفر قوة حسابية قدرها 121 إكسا فلوبس وذاكرة عالية النطاق الترددي مشتركة بسعة 2 بيتابايت، مع أداء معالجة يعادل ثلاثة أضعاف الجيل السابق Ironwood، مع تحسين كفاءة الطاقة بمقدار الضعف.
يزداد عرض النطاق الترددي بين الشرائح بمقدار الضعف، بالتزامن مع إطلاق شبكة Virgo الجديدة، التي يمكن أن تتكون من ما يصل إلى مليون شريحة لتشكيل مجموعة منطقية واحدة، مع إمكانية التوسع بشكل يقارب الخطية.
تقول جوجل إن الهدف هو تقليل دورة تطوير النماذج المتقدمة من عدة أشهر إلى عدة أسابيع.
يستهدف TPU 8i الاستدلال. يمكن لعنصر واحد أن يتصل بـ 1152 وحدة TPU، مزودة بذاكرة عالية النطاق الترددي بسعة 288 جيجابايت وذاكرة SRAM على الشريحة بسعة 384 ميجابايت، والتي تعتبر ثلاثة أضعاف Ironwood، لاستخدامها في إبقاء بيانات النماذج النشطة على الشريحة قدر الإمكان.
شبكة Boardfly الجديدة تقلل بشكل كبير من التأخير، وتقول جوجل إنه يمكنها خدمة ضعف عدد العملاء بنفس التكلفة، بهدف دعم تشغيل ملايين الوكلاء في وقت واحد.
كلا الشريحتين مستضافتان على معالج Axion المستقل من جوجل المبني على بنية ARM، مع تبريد مائي من الجيل الرابع.
تخطط الشركة لتوفيرها رسميًا على منصة Google Cloud AI Hypercomputer في وقت لاحق من عام 2026، بجانب وحدات GPU من إنفيديا.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت