مايكروسوفت تطلق أول نموذج لوكيل ذكي يتحكم بالحاسوب بوساطة 7 مليارات معلمة فارا-7B

robot
إنشاء الملخص قيد التقدم
AIMPACT رسالة، 16 مايو (UTC+8)، أطلقت مايكروسوفت Fara-7B، وهو أول نموذج ذكي صغير مكون من 7 مليارات معلمة مصمم خصيصًا لسيناريوهات استخدام الحاسوب. يعتمد النموذج على بنية فك التشفير متعددة الوسائط، ويمكنه استقبال لقطات الشاشة والنصوص السياقية، والتنبؤ مباشرة بسلاسل تفكير ومعاملات ذات معلمات. تم بناؤه على أساس Qwen 2.5-VL (7B)، ويدعم طول سياق يصل إلى 128 ألف، وتم تدريبه على مدى يومين ونصف على 64 وحدة GPU من نوع H100، ونُشر بموجب ترخيص MIT في 24 نوفمبر 2025. يتيح Fara-7B الإدراك من خلال لقطات الشاشة وتصفح المدخلات، ويجمع بين الاستنتاج الداخلي وسجلات الحالة التاريخية للتنبؤ بالخطوة التالية والإجراءات والمعلمات (مثل إحداثيات النقر)، ويعتمد في تدريبه على مجموعة بيانات اصطناعية واسعة النطاق. يمكن للنموذج تخطيط وتنفيذ مهام عالية المستوى (مثل حجز المطاعم، التقدم لوظائف، تخطيط الرحلات، وغيرها). فيما يخص السلامة والتوافق، يستخدم أسلوب تدريب ما بعد التعزيز القوي، ويملك قدرة على التعرف على النقاط الرئيسية، ويستطيع رفض سبع فئات من المهام التي تنتهك سياسات الاستخدام، ويوقف العمليات عند نقاط توقف رئيسية مثل إدخال المعلومات الشخصية وإتمام عمليات الشراء. يمكن للمستخدمين نشر النموذج والتفاعل معه عبر مستودع GitHub، وأدوات vllm و fara-cli، ويُستخدم بشكل رئيسي في أتمتة مهام الويب. (المصدر: InFoQ)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 8
  • 3
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
AirdropNightwatch
· منذ 5 س
فيما يتعلق بأتمتة المتصفح، أشعر أنه يجب أن أتنافس مباشرة مع استخدام المتصفح واستخدام الكمبيوتر
شاهد النسخة الأصليةرد0
MintCondition
· منذ 6 س
أتمتة مهام الويب، أخيرًا لم أعد بحاجة لكتابة مجموعة من المحددات (selectors)
شاهد النسخة الأصليةرد0
SaveABitOnGasFees
· منذ 6 س
كم نسبة البيانات التي استغرقتها المعايرة بعد التدريب؟ سيتم إصدار الورقة قريبًا
شاهد النسخة الأصليةرد0
GateUser-83c80dd0
· منذ 6 س
7B معلمة كوكيل تخطيط، خفيف الوزن لكن حدود القدرة يجب اختبارها بشكل فعلي
شاهد النسخة الأصليةرد0
GateUser-bee672a5
· منذ 6 س
fara-cli تجربة النشر في انتظار الاختبار، نأمل ألا تكون مثل بعض مشاريع الوثائق السيئة
شاهد النسخة الأصليةرد0
Half-SectionSucculent
· منذ 6 س
توقع الإحداثيات + سلسلة التفكير، التحكم الدقيق أفضل بكثير من واجهة برمجة التطبيقات النصية البحتة
شاهد النسخة الأصليةرد0
0xLateCoffee
· منذ 6 س
128k سياق + إدراك لقطات الشاشة، هذا المزيج له قيمة
شاهد النسخة الأصليةرد0
CandleChaser
· منذ 6 س
إشادة بترخيص MIT، يمكن لـ 7B التشغيل محليًا
شاهد النسخة الأصليةرد0
  • مُثبت