الشركات الأمريكية تتجه نحو نماذج الذكاء الاصطناعي الصينية، وكوينباس تقود باستخدام GLM وKimi

الشركات التكنولوجية الأمريكية تدمج بصمت نماذج الذكاء الاصطناعي الصينية مفتوحة المصدر في البنية التحتية للإنتاج. مع استمرار ارتفاع تكاليف خدمات النماذج الأمريكية الرائدة، بدأت شركات مثل Coinbase في استخدام النماذج الصينية مفتوحة المصدر كخيار افتراضي، وذلك لتقليل نفقات الذكاء الاصطناعي بشكل كبير دون كبح الاستخدام.

أعلن الرئيس التنفيذي لـ Coinbase، برايان أرمسترونغ، مساء الجمعة على منصة X أن الشركة حددت نموذج GLM 5.2 من Zhipu وKimi 2.7 من Beijing Moon's Dark Side كالنماذج الافتراضية للمهندسين عبر بوابة LLM الداخلية. وقال أرمسترونغ إنه مع تحسينات التوجيه والتخزين المؤقت، انخفضت إنفاق Coinbase على الذكاء الاصطناعي "بنحو النصف"، بينما لا يزال استخدام الرموز ينمو بمعدلات أسية.

ميزة التكلفة للنماذج الصينية مفتوحة المصدر تظهر على السطح

أوضح أرمسترونغ في منشوره أن 91% من المهندسين لم يصلوا أبدًا إلى الحد الأعلى للاستخدام، لذلك لم تختر Coinbase خفض الحد أو إضافة تنبيهات استهلاك، بل تحولت إلى "نموذج افتراضي أرخص".

GLM 5.2 من Zhipu وKimi 2.7 من Beijing Moon's Dark Side، كلاهما نماذج وزن مفتوحة المصدر. قال أرمسترونغ إن هذه النماذج تُستخدم في المهام الروتينية، بينما لا يزال بإمكان المهندسين اختيار النماذج المتطورة للمهام التي تتطلب تخطيطًا معقدًا. منطقه هو أن استخدام النماذج المتطورة على المستوى التنفيذي غالبًا ما يكون "مبالغة".

في مراجعة الكود، يتم استخدام استراتيجية متعددة النماذج بالتوازي، حيث تتحقق النماذج المختلفة من مخرجات بعضها البعض للحفاظ على معايير الجودة.

إعادة هيكلة البنية التحتية ثلاثية المستويات تقود خفض التكاليف

أدرج أرمسترونغ ثلاث وسائل أساسية.

الأول هو التوجيه الذكي: في إطار الجدولة المخصصة، يقوم النظام بمعالجة المطالبات مسبقًا، ويجمع بين معدل ضرب التخزين المؤقت وتسعير النموذج، ويوزع المهام تلقائيًا على النموذج الأنسب والأرخص. وقال إن الهدف النهائي هو أن يقوم الذكاء الاصطناعي بدلاً من البشر باختيار النموذج.

الثاني هو التخزين المؤقت النشط: تطلب Coinbase من جميع الطلبات أن تكون واعية بالتخزين المؤقت، وإعادة استخدام ذاكرة التخزين المؤقت الموجودة قدر الإمكان. على سبيل المثال، مع LibreChat، بعد تنفيذ آلية التخزين المؤقت بشكل صحيح، ارتفع معدل ضرب ذاكرة التخزين المؤقت من 5% إلى 60%.

الثالث هو تبسيط السياق: يقترح أرمسترونغ بدء جلسة جديدة عند تبديل المهام، وتقليل نطاق سياق الملف، وفصل الأدوات غير المستخدمة. وأكد أن الهدف ليس تقليل إجمالي استخدام الرموز، بل تقليل "الرموز المهدرة".

الكفاءة أولاً، وليس كبح الاستخدام

وصف أرمسترونغ خفض التكاليف هذا كشرط أساسي لتوسيع نطاق اعتماد الذكاء الاصطناعي، وليس كقيود. وقال إن المهندسين لا يزالون أحرارًا في استخدام أي عدد من الرموز وأي نموذج، لكن الشركة قامت بتصور بيانات الاستخدام وربط الاستخدام بالتأثير التجاري - "كلما أنفقت أكثر، زاد التأثير الذي نتوقعه".

لم يكشف عن أرقام الإنفاق المطلقة المحددة. لكن من الناحية الهيكلية، مع تحقيق نمو هائل في الاستخدام مع خفض الإنفاق إلى النصف تقريبًا، يعني هذا أن Coinbase قد حققت إلى حد ما فصل الاستهلاك عن التكلفة.

استنتج أرمسترونغ أن هذه المنهجية عامة ويمكن لأي شركة تبنيها، لتحقيق توسع مستدام في نطاق استخدام الذكاء الاصطناعي دون جعل التكلفة سقفًا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت