شركة Zhipu AI تطلق نموذج الترميز البصري GLM-5V-Turbo

robot
إنشاء الملخص قيد التقدم

أخبار ME: في 2 أبريل (UTC+8)، أصدرت Zhipu AI مؤخرًا الجيل الجديد من نموذجها الأساسي GLM-5V-Turbo. يهدف هذا النموذج إلى سد الفجوة بين الإدراك البصري وهندسة البرمجيات. على عكس نماذج اللغات الكبيرة القياسية التي تعتمد فقط على تلميحات نصية، يدعم GLM-5V-Turbo بشكل أصلي معالجة مدخلات بصرية مثل المخططات التصميمية واللقطات الشاشة. وقد تم توصيفه بأنه “نموذج ترميز بصري”. ووفقًا لوجهة النظر الواردة في المقال، يتمتع هذا النموذج بإمكانات ترميز متعددة الوسائط بشكل أصلي، ما يجعله قادرًا على فهم مجموعة متنوعة من المدخلات مثل الصور والفيديو والمخططات التصميمية وتخطيطات المستندات، كما حقق أداءً رائدًا في الاختبارات الأساسية من حيث التوازن بين القدرات البصرية وقدرات البرمجة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.28Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.3Kعدد الحائزين:2
    0.16%
  • تثبيت