#Deepseek Goes Viral#


حازت DeepSeek ، وهي شركة ناشئة في مجال الذكاء الاصطناعي مقرها في هانغتشو ، الصين ، على اهتمام كبير في صناعة الذكاء الاصطناعي العالمية بإطلاق نموذج اللغة الكبير DeepSeek-V3 في نهاية ديسمبر 2024. يحتوي هذا النموذج على 671 مليار معلمة ولكنه استغرق حوالي شهرين فقط للتدريب بتكلفة قدرها 5.58 مليون دولار ، وهي أقل بكثير من استثمارات الشركات التكنولوجية الرئيسية الأخرى.
يحقق DeepSeek-V3 أداءًا متفوقًا بين النماذج مفتوحة المصدر ويقارن مع أكثر النماذج المتقدمة في العالم. قامت الشركة بتحسين عملية التدريب لتقليل التكاليف ، باستخدام حوالي 2.78 مليون ساعة GPU مع بطاقات H800 GPUs من Nvidia المنتجة في الصين. هذا يدل على أن شركات الذكاء الاصطناعي الصينية حققت تقدمًا كبيرًا على الرغم من القيود التي فرضتها الولايات المتحدة على الوصول إلى الشرائح الدقيقة المتطورة اللازمة لتدريب الذكاء الاصطناعي.
أثار نجاح DeepSeek مخاوف في صناعة التكنولوجيا الأمريكية، حيث انخفضت أسهم Nvidia وغيرها من شركات التكنولوجيا. يعتقد الخبراء أن DeepSeek حقق أداءً عاليًا بتكلفة أقل بكثير من نظرائها الأمريكية، بفضل استخدام التكنولوجيا مفتوحة المصدر وطرق التدريب الفعالة.
بالإضافة إلى ذلك، أصدرت DeepSeek رمز المصدر وشروحات تقنية مفصلة للنموذج، مما يتيح للباحثين والمطورين في جميع أنحاء العالم الوصول إلى هذه التكنولوجيا وتحسينها. يتناقض هذا التفتح مع النهج الأكثر سرية للشركات الأمريكية الرائدة في مجال الذكاء الاصطناعي وقد يغير طريقة تطوير النماذج لدى شركات التكنولوجيا الكبيرة في المستقبل.
MAJOR11.07%
S3.81%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت