شركات التكنولوجيا الأمريكية تتحول بهدوء إلى نماذج الذكاء الاصطناعي الصينية، وشركة Coinbase تقود باستخدام GLM وKimi.

robot
إنشاء الملخص قيد التقدم
شركات التكنولوجيا الأمريكية تدمج بهدوء نماذج AI مفتوحة المصدر الصينية في البنية التحتية للإنتاج.
مع استمرار ارتفاع تكلفة خدمات النماذج الأمريكية الرائدة، بدأت شركات مثل Coinbase في اعتماد النماذج مفتوحة المصدر الصينية كخيار افتراضي، مما يقلل بشكل كبير من نفقات AI دون تقليل حجم الاستخدام.
كشف الرئيس التنفيذي لـ Coinbase، بريان أرمسترونغ، في منشور على منصة X مساء الجمعة الماضية، أن الشركة قامت بتعيين نماذج GLM 5.2 (من زيبو) وKimi 2.7 (من مونشوت آي في بكين) كنماذج افتراضية للمهندسين عبر بوابة LLM الداخلية.
صرح أرمسترونغ أنه بعد الجمع بين تحسين التوجيه وتحسين التخزين المؤقت، انخفضت نفقات AI لـ Coinbase "تقريبًا إلى النصف"، بينما لا يزال استخدام التوكنات ينمو بمعدل أسي.
تظهر ميزة التكلفة للنماذج الصينية مفتوحة المصدر على السطح
---------------
أوضح أرمسترونغ في المنشور أن 91% من المهندسين لم يصلوا أبدًا إلى الحد الأقصى للاستخدام الأصلي، لذلك لم تختر Coinbase خفض الحد الأقصى أو إضافة تنبيهات الاستهلاك، بل تحولت إلى "نماذج افتراضية أرخص".

GLM 5.2 من زيبو، وKimi 2.7 من مونشوت آي في بكين، وكلاهما نماذج مفتوحة المصدر بالأوزان.
قال أرمسترونغ إن هذه النماذج تُستخدم في المهام الروتينية، بينما يمكن للمهندسين اختيار النماذج المتطورة للمهام التي تتطلب تخطيطًا معقدًا.
منطقه هو أن استخدام النماذج المتطورة على مستوى التنفيذ غالبًا ما يكون "إفراطًا في الاستخدام".
في مرحلة مراجعة الكود، يتم استخدام استراتيجية متعددة النماذج بالتوازي، مما يسمح للنماذج المختلفة بالتحقق من نتائج بعضها البعض للحفاظ على معايير الجودة.
إعادة هيكلة البنية التحتية ثلاثية المستويات تقود إلى خفض التكاليف
--------------
أدرج أرمسترونغ ثلاث وسائل أساسية.
الأول هو التوجيه الذكي: في إطار الجدولة المخصصة، يقوم النظام بمعالجة الاستعلامات مسبقًا، مع الأخذ في الاعتبار معدل الإصابة في التخزين المؤقت وتسعير النموذج، وتوزيع المهام تلقائيًا على النموذج الأكثر ملاءمة والاقتصادي.
وأشار إلى أن الهدف النهائي هو جعل AI، وليس البشر، يقوم بمهمة اختيار النموذج.
الثاني هو التخزين المؤقت النشط: تطلب Coinbase من جميع الطلبات أن تكون قادرة على التعرف على التخزين المؤقت، وإعادة استخدام التخزين المؤقت الحالي قدر الإمكان.
على سبيل المثال، مع LibreChat، بعد تنفيذ آلية التخزين المؤقت بشكل صحيح، ارتفع معدل الإصابة في التخزين المؤقت من 5% إلى 60%.
الثالث هو تقليل السياق: نصح أرمسترونغ ببدء جلسة جديدة عند تبديل المهام، وتضييق نطاق سياق الملف، وقطع اتصالات الأدوات غير المستخدمة.
وأكد أن الهدف ليس تقليل إجمالي استخدام التوكنات، بل تقليل "التوكنات المهدرة".
الكفاءة أولاً، وليس تقييد الاستخدام
-----------
وصف أرمسترونغ تخفيض التكلفة هذا كشرط أساسي لتوسيع نطاق اعتماد AI، وليس كقيود.
وقال إن المهندسين لا يزالون أحرارًا في استخدام أي عدد من التوكنات وأي نموذج، لكن الشركة قامت بتصور بيانات الاستخدام وربط الاستخدام بالتأثير التجاري - "كلما أنفقت أكثر، كلما زاد التأثير المتوقع".
لم يكشف عن أرقام الإنفاق المطلقة المحددة.
ولكن من الناحية الهيكلية، فإن تحقيق تخفيض في الإنفاق بنحو النصف بينما ينمو الاستخدام بشكل أسي، يعني أن Coinbase قد فصلت إلى حد ما بين الاستهلاك والتكلفة.
استنتج أرمسترونغ أن هذه المنهجية قابلة للتطبيق عالميًا، ويمكن لأي شركة الاستفادة منها لتحقيق توسع مستدام في استخدام AI دون جعل التكلفة سقفًا.
إخلاء مسؤولية وتحذير المخاطر

السوق بها مخاطر، والاستثمار يتطلب الحذر. هذا المقال لا يشكل توصية استثمارية فردية، ولا يأخذ في الاعتبار الأهداف الاستثمارية الخاصة أو الظروف المالية أو احتياجات المستخدمين الفردية. يجب على المستخدمين النظر في ما إذا كانت أي آراء أو وجهات نظر أو استنتاجات في هذا المقال تتناسب مع وضعهم الخاص. الاستثمار بناءً عليه يكون على مسؤوليتهم الخاصة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت