أطلقت جوجل الجيل الثامن من وحدة المعالجة التنسية TPU، حيث تم تقسيم تدريب الاستنتاج لأول مرة إلى شريحتين مستقلتين

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 22 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة Beating، أعلن الرئيس التنفيذي لشركة جوجل سوندار بيتشاي في مؤتمر Cloud Next 2026 عن الجيل الثامن من وحدات معالجة Tensor (TPU)، حيث تم لأول مرة فصل التدريب والاستدلال إلى شريحتين مستقلتين.
يستهدف TPU 8t التدريب. يمكن لعنصر خادم فائق واحد أن يتصل بـ 9600 وحدة TPU، ويوفر قوة حسابية قدرها 121 إكسا فلوبس وذاكرة عالية النطاق الترددي مشتركة بسعة 2 بيتابايت، مع أداء معالجة يعادل ثلاثة أضعاف الجيل السابق Ironwood، مع تحسين كفاءة الطاقة بمقدار الضعف.
يزداد عرض النطاق الترددي بين الشرائح بمقدار الضعف، بالتزامن مع إطلاق شبكة Virgo الجديدة، التي يمكن أن تتكون من ما يصل إلى مليون شريحة لتشكيل مجموعة منطقية واحدة، مع إمكانية التوسع بشكل شبه خطي.
تقول جوجل إن الهدف هو تقليل دورة تطوير النماذج المتقدمة من عدة أشهر إلى عدة أسابيع.
يستهدف TPU 8i الاستدلال. يتصل حاوية واحدة بـ 1152 وحدة TPU، مزودة بذاكرة عالية النطاق الترددي بسعة 288 جيجابايت وذاكرة SRAM على الشريحة بسعة 384 ميجابايت، والتي تعتبر ثلاثة أضعاف Ironwood، بهدف إبقاء بيانات النماذج النشطة على الشريحة قدر الإمكان.
تقلل شبكة Boardfly الجديدة من زمن التأخير بشكل كبير، وتقول جوجل إنه يمكنها خدمة ضعف عدد العملاء بنفس التكلفة، مع الهدف من دعم تشغيل ملايين الوكلاء في وقت واحد.
كلا الشريحتين مستضافتان على معالج Axion من تصميم جوجل يعتمد على بنية ARM، مع تبريد مائي من الجيل الرابع.
تخطط جوجل لتوفيرها رسميًا على منصة Google Cloud AI Hypercomputer في وقت لاحق من عام 2026، بجانب وحدات GPU من إنفيديا.
(المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت