DeepSeek الاختبار التجريبي لوضع "التعرف على الصور"، القدرة متعددة الوسائط تُفتح رسميًا | حصري

robot
إنشاء الملخص قيد التقدم

موقع مارس فاينانس الأخبارية 29 أبريل، أبلغ بعض المستخدمين أن نسخة الويب من DeepSeek أطلقت وضع “التعرف على الصور”. اكتُشف أثناء التجربة أن هذا الوضع يدعم رفع المستخدمين للصور وفهم المحتوى وتحليله. حاليًا، لم يتم بعد إطلاق هذه الميزة بشكل كامل، ولا تزال حدود الوظائف غير واضحة. ومن الجدير بالذكر أنه اليوم، نشر الباحث المسؤول عن تطوير النماذج متعددة الوسائط في DeepSeek، تشن شياوكانغ، منشورًا على منصة X قال فيه “الآن، نراك” مع صورة، حيث أزال شعار DeepSeek “الحوت” غطاء العين. في بداية هذا الشهر، أطلقت DeepSeek وضعين جديدين هما “الوضع السريع” و"وضع الخبراء"، الأول مناسب للمحادثات اليومية والاستجابة الفورية؛ والثاني متخصص في المشكلات المعقدة ويحتاج إلى انتظار في أوقات الذروة. في ذلك الوقت، ظهرت لقطات شاشة متداولة تُظهر أن بالإضافة إلى “الوضع السريع” و"وضع الخبراء"، هناك وضع آخر يُسمى “رؤية”. يتطابق أحدث وضع “التعرف على الصور” بشكل كبير مع مدخل “الرؤية” الذي تم تداوله سابقًا. يُعتقد أن فتح قدرات DeepSeek متعددة الوسائط يعني أن مجموعة منتجاتها تتوسع من الحوار النصي البحت إلى التفاعل بين الصور والنصوص، وتقترب من نماذج متعددة الوسائط الرائدة مثل GPT-4o و Gemini. (مراقبة واسعة النطاق)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت