智谱发布原生多模态Coding基模GLM-5V-Turbo,深度适配OpenClaw

robot
إنشاء الملخص قيد التقدم

سينا تيكنولوجي نيوز، 2 أبريل - أعلنت شركة زيبور عن إطلاق أول نموذج أساسي متعدد الوسائط من نوع Coding باسم GLM-5V-Turbo، والذي يدمج بشكل عميق القدرات البصرية والبرمجية، قادر على معالجة المعلومات متعددة الوسائط مثل النصوص والصور والفيديوهات بشكل أصلي، بالإضافة إلى تفوقه في البرمجة والتخطيط الطويل والتنفيذ العملياتي وغيرها من المهام المعقدة.

ووفقًا للمعلومات، حقق نموذج GLM-5V-Turbo أداءً متقدمًا في معايير أساسية مثل Coding متعدد الوسائط وAgent، باستخدام حجم أصغر، مع إدخال القدرة على الرؤية، مع الحفاظ على مستوى مماثل في البرمجة والاستنتاج النصي الخالص. كما أنه يتكيف بشكل عميق مع سيناريوهات كلاود كود وLobster، مما يمنح OpenClaw القدرة على الرؤية الحقيقية، بحيث يمكنه فهم المعلومات على الشاشة.

على عكس نماذج Coding النصية التقليدية، يمكن لنموذج GLM-5V-Turbo فهم المعلومات البصرية مثل التصاميم، لقطات الشاشة، ومخططات الشموع، وإنتاج رموز قابلة للتشغيل، مما يحقق تجربة برمجة بالذكاء الاصطناعي “كما ترى، تنفذ”. حاليًا، أصبح هذا النموذج متاحًا عبر منصة MaaS الخاصة بزيبور. (مقال من يانغ سي)

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.3Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.3Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • تثبيت