موقع مارس فاينانس الأخبارية 29 أبريل، أبلغ بعض المستخدمين أن نسخة الويب من DeepSeek أطلقت وضع "التعرف على الصور". اكتُشف أثناء التجربة أن هذا الوضع يدعم رفع المستخدمين للصور وفهم المحتوى وتحليله. حاليًا، لم يتم بعد إطلاق هذه الميزة بشكل كامل، ولا تزال حدود الوظائف غير واضحة. ومن الجدير بالذكر أنه اليوم، نشر الباحث المسؤول عن تطوير النماذج متعددة الوسائط في DeepSeek، تشن شياوكانغ، منشورًا على منصة X قال فيه "الآن، نراك" مع صورة، حيث أزال شعار DeepSeek "الحوت" غطاء العين. في بداية هذا الشهر، أطلقت DeepSeek وضعين جديدين هما "الوضع السريع" و"وضع الخبراء"، الأول مناسب للمحادثات اليومية والاستجابة الفورية؛ والثاني متخصص في المشكلات المعقدة ويحتاج إلى انتظار في أوقات الذروة. في ذلك الوقت، ظهرت لقطات شاشة متداولة تُظهر أن بالإضافة إلى "الوضع السريع" و"وضع الخبراء"، هناك وضع آخر يُسمى "رؤية". يتطابق أحدث وضع "التعرف على الصور" بشكل كبير مع مدخل "الرؤية" الذي تم تداوله سابقًا. يُعتقد أن فتح قدرات DeepSeek متعددة الوسائط يعني أن مجموعة منتجاتها تتوسع من الحوار النصي البحت إلى التفاعل بين الصور والنصوص، وتقترب من نماذج متعددة الوسائط الرائدة مثل GPT-4o و Gemini. (مراقبة واسعة النطاق)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
LABPlunges53PercentInTwoDays
3.09M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
71.9K درجة الشعبية
#
WorldCupChampionPrediction
214.21K درجة الشعبية
#
USIranWarCloudsGather
3.71M درجة الشعبية
#
GUSDYieldRisesto3.8%
908.18K درجة الشعبية

مُثبت

خريطة الموقع

DeepSeek الاختبار التجريبي لوضع "التعرف على الصور"، القدرة متعددة الوسائط تُفتح رسميًا | حصري

المواضيع الرائجة

LABPlunges53PercentInTwoDays

IsraelStrikesIranBTCPlunges

WorldCupChampionPrediction

USIranWarCloudsGather

GUSDYieldRisesto3.8%

مُثبت