F5 و NVIDIA يعززان اقتصاديات مصنع الذكاء الاصطناعي بقدرات جديدة للاستدلال المتسارع للذكاء الاصطناعي

(منفعتن - أخبار أصاف) ** دبي – أخبار أصاف:**

F5 (ناسداك: FFIV)، الرائد العالمي في تقديم وتأمين كل تطبيق وواجهة برمجة تطبيقات، أعلن اليوم عن توسيع قدراته في إطار ** التعاون المستمر**

يدمج التكامل الموسع بين ** F5 BIG-IP Next لـ Kubernetes**

في أنظمة الذكاء الاصطناعي، تمثل الرموز الوحدة القابلة للقياس لمخرجات الذكاء الاصطناعي — الكلمات، الرموز، أو أجزاء البيانات التي يتم إنشاؤها ومعالجتها أثناء الاستنتاج. حجم وسرعة إنتاج الرموز يحددان في النهاية تجربة المستخدم، وكفاءة البنية التحتية، والإيرادات لكل معجل.

مع سعي المؤسسات ومزودي GPUaaS لتحقيق أرباح من الذكاء الاصطناعي والانتقال من تجارب الذكاء الاصطناعي إلى خدمات تولد إيرادات، أصبحت كفاءة البنية التحتية مقياسًا حاسمًا. يُقاس النجاح بشكل متزايد ليس فقط بسعة GPU المنشورة، بل أيضًا باقتصاد الرموز، واستمرارية تدفق الرموز، ووقت الوصول إلى الرمز الأول (TTFT)، وتكلفة كل رمز، والإيرادات لكل معجل GPU. الحل المشترك بين F5 و NVIDIA مصمم لمعالجة هذه المقاييس مباشرة.

** تحسين اقتصاد الرموز من خلال بنية تحتية ذكية للذكاء الاصطناعي**

التحول من الاستنتاج المرتكز على التطبيق إلى سير عمل الذكاء الاصطناعي المدفوع بالوكيل يتطلب نهجًا معماريًا جديدًا لتحسين تدفق الرموز وتقليل التكاليف. الآن، يستخدم BIG-IP Next لـ Kubernetes إحصائيات NVIDIA NIM، وإشارات وقت تشغيل Dynamo، وبيانات قياس GPU لاتخاذ قرارات توجيه واعية بالاستنتاج قبل التنفيذ. من خلال مطابقة الأحمال مع المعجلات الأنسب في الوقت الحقيقي، يزيد الحل من الاستخدام المستمر مع تقليل الكمون وإعادة الحساب.

قال كونوال أناند، رئيس قسم المنتجات في F5: “لم يعد البنية التحتية للذكاء الاصطناعي مجرد الوصول إلى GPU أو توسيع نشراتها. لقد تطورت إلى تعظيم الناتج الاقتصادي لكل معجل.” “مع NVIDIA، نمكن مصانع الذكاء الاصطناعي من اعتبار إنتاج الرموز كمقياس تجاري قابل للقياس. يوفر BIG-IP Next لـ Kubernetes الذكاء والحوكمة اللازمة لزيادة عائد GPU، وتقليل تكلفة كل رمز، وتوسيع منصات الذكاء الاصطناعي المشتركة بثقة.”

** كفاءة البنية التحتية المعتمدة: تحسين هيكلي**

الأرقام الأداء تتحدث عن نفسها. في اختبار موثوق من قبل مجموعة Tolly، قدم BIG-IP Next لـ Kubernetes، المدعوم من قبل وحدات معالجة NVIDIA BlueField-3، زيادة تصل إلى 40% في تدفق الرموز، ووقت أسرع بنسبة 61% للوصول إلى الرمز الأول (TTFT)، وتقليل بنسبة 34% في زمن استجابة الطلب الكلي.

هذه ليست مكاسب تدريجية. من خلال تفريغ الشبكة، وتشفير TLS، وتوازن الحمل الذكي للذكاء الاصطناعي، وإدارة حركة المرور إلى وحدات BlueField-3 DPU، يحافظ BIG-IP Next لـ Kubernetes على قدرة وحدة المعالجة المركزية المضيفة ويحرر وحدات GPU للقيام بما صممت من أجله: استنتاج عالي التدفق ومستمر على نطاق واسع. النتيجة هي تحسين استخدام GPU، وتقليل تأخيرات الانتظار، وزيادة إنتاج الرموز — مما يتيح تقليل التكلفة لكل رمز ضمن بنية تحتية ثابتة. والأهم من ذلك، لم تكن هناك حاجة لتعديلات على النماذج، مما يجعل هذه المكاسب قابلة للنشر فورًا عبر البنية التحتية الحالية لمصانع الذكاء الاصطناعي. للمؤسسات ومزودي NeoCloud الذين يتنافسون على اقتصاديات الرموز، هذا هو الفرق بين بنية تحتية تقيد مخرجات الذكاء الاصطناعي وبنية تحتية تسرعها.

قال كيفن دييرلينج، نائب رئيس أول، الشبكات في NVIDIA: “البنية التحتية للحوسبة المعجلة من NVIDIA، إلى جانب منصة توصيل التطبيقات والأمان المدركة للذكاء الاصطناعي من F5، تفتح آفاقًا متفوقة لاقتصاديات رموز مصانع الذكاء الاصطناعي — حيث تقدم استنتاجات قابلة للتوسع وفعالة من حيث التكلفة دون الحاجة إلى تعديل النماذج.” “معًا، تمكّن F5 و NVIDIA المؤسسات من توسيع استنتاجات مصانع الذكاء الاصطناعي بكفاءة واقتصادية.”

** مصممة للذكاء الاصطناعي المدفوع بالوكيل ومنصات الذكاء الاصطناعي متعددة المستأجرين**

تزداد أعباء العمل الحديثة للذكاء الاصطناعي اعتمادًا على الوكيل، وتكون مستمرة، ومرتبطة بالسياق. تتطلب تحكمًا ذكيًا في حركة المرور لا يمكن أن توفره توازنات الحمل التقليدية. يمكن الآن لنظام BIG-IP Next لـ Kubernetes المدعوم أن يدعم:

  • التوجيه الواعي بالاستنتاج لعمليات الذكاء الاصطناعي المدفوعة بالوكيل
  • التكامل مع منصة NVIDIA DOCA (DPF) لتبسيط نشر وإدارة دورة حياة وحدات BlueField DPU
  • EVPN-VXLAN مع VRFs ديناميكية لأمان الشبكة متعدد المستأجرين
  • أمن مدمج، وحوكمة الرموز، ورصد داخل بيئات Kubernetes للذكاء الاصطناعي

تمكن هذه القدرات المؤسسات ومزودي NeoCloud من مشاركة بنية GPU التحتية بشكل آمن عبر وحدات الأعمال أو العملاء الخارجيين مع الحفاظ على عزل الأداء ومستويات الخدمة المتوقعة.

** منصة تحكم لاقتصاديات مصنع الذكاء الاصطناعي**

توفر F5 و NVIDIA أدوات موثوقة وأفضل الممارسات للمؤسسات لتحسين بنية الاستنتاج. مع هذه التطورات، يُحتمل أن يصبح BIG-IP Next لـ Kubernetes منصة تحكم استراتيجية لاقتصاديات مصنع الذكاء الاصطناعي، حيث يتحكم في استهلاك الرموز، ويُحسن تدفقات الحركة، ويعظم عائد الاستثمار في البنية التحتية.

بدلاً من الإفراط في تخصيص الموارد لتعويض الكفاءات، يمكن للمؤسسات الآن استخراج قيمة اقتصادية أكبر من كل GPU موجود بالفعل في الإنتاج. النتيجة هي زيادة الإيرادات لكل GPU، وتقليل الأعباء التشغيلية، وخدمات ذكاء اصطناعي قابلة للتوسع من أجل النمو المستدام. من خلال دمج قياسات البنية التحتية وتسريع DPU من NVIDIA مع ذكاء حركة المرور وأمان F5، تساعد الشركات المؤسسات على تحويل مصانع الذكاء الاصطناعي إلى منصات فعالة وقابلة للتسويق جاهزة لعصر الوكيل.

** مواد داعمة**

** مدونة:** ** مصانع الذكاء الاصطناعي بحاجة إلى بنية تحتية ذكية. نتائج جديدة من مجموعة Tolly توضح السبب. ** تقرير:** ** اختبار مستقل من Tolly: F5 BIG-IP Next لـ Kubernetes


شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.32Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.33Kعدد الحائزين:1
    0.00%
  • تثبيت