تكلفة الاستدلال فقط تساوي واحدًا من عشرين من GPT-5.5، ونموذج Gemini 3.2 في الوقت الحقيقي يظهر على جوجل كلاود

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، ظهرت خيار النموذج الأساسي المسمى gemini-3.2-flash-lite-live-preview في قائمة تصفية النماذج في وحدة تحكم Google Cloud. هذا هو تكرار ظهور سلسلة النماذج على المنصة الرسمية بعد أن كشفت عنها في بداية هذا الشهر في حزمة بناء تطبيق iOS و AI Studio. الخيار الجديد يحمل لاحقتي lite و live، مما يدل على أن جوجل تقوم بتقسيم إصدار مخصص للتفاعل في الوقت الحقيقي منخفض التأخير للغاية. صرحت الرئيسة التنفيذية لشركة Abacus.AI، بيندو ريدي، سابقًا أن قدرة ترميز واستنتاج Gemini 3.2 Flash تصل إلى 92% من GPT-5.5، ولكن بفضل تقنية التقطير والتخفيف، فإن تكلفة الاستنتاج أقل بمقدار واحد على عشرين من الأخيرة، مع تأخير معظم الاستعلامات أقل من 200 مللي ثانية. مع تقدم واجهات السحابة في السباق المبكر، يتوقع الصناعة أن يتم إطلاق هذا النموذج الخفيف ذو الأداء الممتاز من حيث التكلفة في مؤتمر Google I/O في 20 مايو.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت