DeepSeek V4-Flash يصل إلى Ollama Cloud، استضافة أمريكية: Claude Code، OpenClaw توصيل بنقرة واحدة

robot
إنشاء الملخص قيد التقدم

أدات تشغيل نماذج الذكاء الاصطناعي المحلية Ollama أعلن علنًا على منصة X في 24/4 أنه سيتم إدراج نموذج DeepSeek V4-Flash الذي أطلقته شركة DeepSeek الناشئة في مجال الذكاء الاصطناعي في الصين في اليوم السابق ضمن خدمة Ollama Cloud. تقع خادم الاستدلال في الولايات المتحدة، ويقدم ثلاث مجموعات من أوامر بنقرة واحدة تتيح للمطورين توصيل V4-Flash مباشرةً بواجهات عمل تطوير برمجيات ذكاء اصطناعي شائعة مثل Claude Code وOpenClaw وHermes.

deepseek-v4-flash is now available on Ollama’s cloud! Hosted in the US. Try it with Claude Code: ollama launch claude –model deepseek-v4-flash:cloud Try it with OpenClaw: ollama launch openclaw –model deepseek-v4-flash:cloud Try it with Hermes: ollama launch hermes…

— ollama (@ollama) April 24, 2026

معاينة DeepSeek V4: حجمان، سياق 1M

وفقًا لإعلان منشور في 4/24 في وثائق واجهة برمجة تطبيقات DeepSeek الرسمية، تم إطلاق DeepSeek-V4 Preview في نسختين بحجمين متزامنين مع فتح المصدر:

النوع إجمالي المعلمات المعلمات النشطة الموضع DeepSeek-V4-Pro 1.6 تريليون 49 مليار هدفًا لمضاهاة الرائد المغلق المصدر DeepSeek-V4-Flash 2,840 مليار 130 مليار سريع وفعّال ومنخفض التكلفة

تستخدم النسختان معمارية Mixture-of-Experts(MoE)، وتدعم أصليًا سياقًا طويلًا يصل إلى 1 مليون token. وذكرت DeepSeek في الإعلان: «إن سياق 1M أصبح القيمة الافتراضية لجميع خدمات DeepSeek الرسمية».

ابتكار معماري: DSA Sparse Attention + ضغط على مستوى الرمز Token-wise

تتضمن تحسينات المعمارية الأساسية لسلسلة V4:

ضغط Token-wise بالاقتران مع DSA(DeepSeek Sparse Attention)—— لتقليل تكاليف عمليات الاستدلال وذاكرة التخزين المؤقت لـ KV بشكل كبير في سياقات فائقة الطول

مقارنةً بـ V3.2، في سيناريو سياق 1 مليون token، يحتاج V4-Pro لكل token إلى 27% فقط من FLOPs، بينما تحتاج ذاكرة KV cache إلى 10% فقط

يدعم التبديل بين نمطي Thinking وNon-Thinking، بما يتوافق مع احتياجات الاستدلال العميق لمهام مختلفة

على مستوى واجهة برمجة التطبيقات، يتوافق أيضًا مع مواصفات OpenAI ChatCompletions وAnthropic APIs، مما يقلل تكاليف ترحيل العملاء الحالية لواجهات Claude/GPT.

أوامر البدء بنقرة واحدة الثلاثة لـ Ollama Cloud

تقدم صفحة النماذج الرسمية في Ollama خدمة الاستدلال السحابي عبر معرّف النموذج deepseek-v4-flash:cloud، ويمكن للمطورين استخدام مجموعات الأوامر الثلاثة التالية لتوصيل V4-Flash مباشرةً بعمليات تطوير البرمجيات الخاصة بالذكاء الاصطناعي القائمة:

سير العمل الأمر Claude Code ollama launch claude --model deepseek-v4-flash:cloud OpenClaw ollama launch openclaw --model deepseek-v4-flash:cloud Hermes ollama launch hermes

تجدر الإشارة إلى إشارة «خادم الولايات المتحدة». بالنسبة للشركات والمطورين في أوروبا وأمريكا، أكبر قلق عند استخدام نماذج صينية مفتوحة المصدر هو عودة البيانات إلى الصين؛ اختارت Ollama وضع طبقة الاستدلال الخاصة بـ V4-Flash في الولايات المتحدة، ما يعني أن prompt ومحتوى الكود لا يغادران نطاق الاختصاص القضائي الأمريكي، مما يقلل الاحتكاك على مستوى الامتثال وحقوق السيادة على البيانات.

لماذا تعتبر هذه القضية مهمة لصناعة الذكاء الاصطناعي

من خلال ربط DeepSeek V4-Flash وOllama Cloud وClaude Code التي كانت مستقلة سابقًا في كل نظام بيئي، تتولد ثلاث دلالات:

مسار التكلفة: عدد المعلمات النشطة البالغ 130 مليار في V4-Flash أقل بكثير من GPT-5.5(إدخال 5 دولارات، إخراج 30 دولارًا لكل مليون tokens)وClaude Opus 4.7 وغيرها من الطرازات الرائدة؛ وبالنسبة لمهام الوكلاء متوسطة وصغيرة الحجم، وملخصات الدفعات، وأتمتة الاختبارات، من المتوقع أن ينخفض التكلفة لكل وحدة بشكل ملحوظ

طبقة وسيطة للمخاطر الجغرافية: باعتبار Ollama طبقة وسيطة للاستدلال المسجلة في الولايات المتحدة، يتيح ذلك للمستخدمين التجاريين للنماذج الأصلية الصينية تجاوز القلق من «إرسال البيانات مباشرةً إلى خادم DeepSeek في بكين»، وهي حل عملي لانتشار النماذج مفتوحة المصدر عالميًا

التبديل الفوري للمطورين: يمكن لمستخدمي Claude Code وOpenClaw تبديل النموذج في سطر واحد عبر سطر الأوامر دون تغيير بنية prompt أو إعدادات IDE، وهو ما يمثل إطلاقًا فعليًا للإنتاجية في سيناريوهات مثل «اختبارات الانحدار عبر نماذج متعددة» و«مهام الدفعات الحساسة للتكلفة»

الربط مع أخبار DeepSeek السابقة

يأتي إصدار V4 هذا مع التكامل السريع مع Ollama Cloud في سياق مفاوضات DeepSeek على تمويل خارجي في الجولة الأولى وتقييم يبلغ 200 مليار دولار. يُعد V4 إثباتًا لمنتج محوري في عملية رسملة شركة DeepSeek؛ وباستراتيجية مفتوحة المصدر مع الشركاء المشاركين في استضافة دولية لتوسيع الانتشار بسرعة، فإن ذلك هو «معركة السرعة» قبل بناء احتكار نظام مطوري التطبيقات. بالنسبة لـ OpenAI وAnthropic، فإن نموذج بديل مفتوح المصدر يمكن تبديله بسطر واحد داخل Claude Code هو متغير جديد في المنافسة على سيطرة سير عمل الوكلاء agent.

ظهرت هذه المقالة DeepSeek V4-Flash ينطلق على Ollama Cloud، خادم الولايات المتحدة:Claude Code وOpenClaw توصيل بنقرة واحدة لأول مرة على 链新闻 ABMedia.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت