أطلقت جوجل الجيل الثامن من وحدة المعالجة التوربينية (TPU)، حيث تم تقسيم تدريب الاستنتاج لأول مرة إلى شريحتين مستقلتين من الرقائق

أخبار ME، 22 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أعلن الرئيس التنفيذي لشركة جوجل سوندار بيتشاي في مؤتمر Cloud Next 2026 عن الجيل الثامن من وحدات معالجة Tensor (TPU)، والذي يفرق لأول مرة بين التدريب والاستدلال عبر شريحتين مستقلتين.
يستهدف TPU 8t التدريب. يمكن لعنصر خادم فائق واحد أن يتصل بـ 9600 وحدة TPU، ويوفر قوة حسابية قدرها 121 إكسا فلوبس وذاكرة عالية النطاق الترددي مشتركة بسعة 2 بيتابايت، مع أداء معالجة يعادل ثلاثة أضعاف الجيل السابق Ironwood، مع تحسين كفاءة الطاقة بمقدار الضعف.
يزداد عرض النطاق الترددي بين الشرائح بمقدار الضعف، بالتزامن مع إطلاق شبكة Virgo الجديدة، التي يمكن أن تتكون من ما يصل إلى مليون شريحة لتشكيل مجموعة منطقية واحدة، مع إمكانية التوسع تقريبًا بشكل خطي.
تقول جوجل إن الهدف هو تقليل دورة تطوير النماذج المتقدمة من عدة أشهر إلى عدة أسابيع.
يستهدف TPU 8i الاستدلال. يربط حاوية واحدة 1152 وحدة TPU، مزودة بذاكرة عالية النطاق الترددي بسعة 288 جيجابايت وذاكرة SRAM على الشريحة بسعة 384 ميجابايت، والتي تعادل ثلاثة أضعاف Ironwood، بهدف إبقاء بيانات النماذج النشطة على الشريحة قدر الإمكان.
تقلل شبكة Boardfly الجديدة من زمن التأخير بشكل كبير، وتقول جوجل إنه يمكنها خدمة ضعف عدد العملاء بنفس التكلفة، بهدف دعم تشغيل ملايين الوكلاء في وقت واحد.
كلا الشريحتين مستضافتان على معالج Axion من جوجل المبني على معمارية ARM، مع تبريد مائي من الجيل الرابع.
تخطط جوجل لتوفيرها رسميًا على منصة Google Cloud AI Hypercomputer في وقت لاحق من عام 2026، بجانب وحدات GPU من إنفيديا.
(المصدر: BlockBeats)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت