شركة Zhipu AI تطلق نموذج الترميز البصري GLM-5V-Turbo

robot
إنشاء الملخص قيد التقدم

أخبار ME، 2 أبريل (UTC+8)، نشرت Zhipu AI مؤخرًا نموذجًا أساسيًا جديدًا من الجيل التالي GLM-5V-Turbo. يهدف هذا النموذج إلى سد الفجوة بين الإدراك البصري وهندسة البرمجيات. على عكس نماذج اللغات الكبيرة القياسية التي تعتمد فقط على المطالبات النصية، يدعم GLM-5V-Turbo بشكل أصلي معالجة المدخلات البصرية مثل المخططات التصميمية واللقطات الشاشة، وتم تحديده باعتباره “نموذج ترميز بصري”. ووفقًا لوجهة النظر الواردة في المقال، يتمتع هذا النموذج بقدرات ترميز متعددة الوسائط أصلية، ويمكنه فهم صور وفيديوهات ومخططات تصميمية وتخطيطات المستندات وغيرها من أنواع المدخلات، وقد حقق أداءً رائدًا في اختباراته الأساسية من حيث التوازن بين القدرات البصرية وقدرات البرمجة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.28Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت