شركة Zhipu AI تطلق نموذج الترميز البصري GLM-5V-Turbo

robot
إنشاء الملخص قيد التقدم

أخبار ME، 2 أبريل (UTC+8)، أطلقت Zhipu AI مؤخرًا نموذجًا أساسيا جديدًا من الجيل التالي GLM-5V-Turbo. يهدف هذا النموذج إلى سد الفجوة بين الإدراك البصري والهندسة البرمجية. وبخلاف نماذج اللغات الكبيرة القياسية التي تعتمد فقط على تلميحات النص، يدعم GLM-5V-Turbo بشكل أصلي معالجة المدخلات البصرية مثل المخططات التصميمية واللقطات الشاشة، وتم تحديده باعتباره “نموذج ترميز بصري”. ووفقًا لوجهة النظر الواردة في المقال، يتمتع هذا النموذج بإمكانات أصلية للترميز متعدد الوسائط، ما يجعله قادرًا على فهم مجموعة متنوعة من المدخلات مثل الصور ومقاطع الفيديو والمخططات التصميمية وتخطيطات المستندات، وقد حقق أداءً رائدًا في اختبارات معيارية أساسية من حيث التوازن بين القدرات البصرية وقدرات البرمجة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.28Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت