شركة Zhipu AI تطلق نموذج الترميز البصري GLM-5V-Turbo

robot
إنشاء الملخص قيد التقدم

أخبار ME: في 2 أبريل (UTC+8)، أطلقت Zhipu AI مؤخرًا نموذجًا أساسيًا جديدًا من الجيل التالي GLM-5V-Turbo. يهدف هذا النموذج إلى سد الفجوة بين الإدراك البصري والهندسة البرمجية. بخلاف نماذج اللغات الكبيرة القياسية التي تعتمد فقط على تلميحات نصية، يدعم GLM-5V-Turbo بشكل أصلي معالجة المدخلات البصرية مثل المخططات التصميمية واللقطات المصوّرة، وقد تم توصيفه كنموذج “للترميز البصري”. وفقًا لوجهة النظر المذكورة في المقال، يتمتع هذا النموذج بإمكانيات ترميز متعددة الوسائط أصلية، ما يجعله قادرًا على فهم مجموعة متنوعة من المدخلات مثل الصور والفيديوهات والمخططات التصميمية وتخطيطات المستندات، وقد حقق أداءً متقدمًا في اختبارات قياسية أساسية من حيث تحقيق التوازن بين قدرات الرؤية والبرمجة. (المصدر: InFoQ)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت