أكبر إصدار مفتوح المصدر في أوروبا: سبر تصدر مجموعة من الشبكات العصبية الروسية المتطورة

( MENAFN ) يفتح Sber أوزان نموذجين جديدين من طراز MoE رائدين ضمن سلسلة GigaChat — Ultra Preview وLightning — تم تدريبهما من الصفر لمهام اللغة الروسية، إلى جانب الجيل التالي من نماذج التعرف على الكلام المفتوحة GigaAM-v3 الملمة بعلامات الترقيم والتطبيع.

	علاوة على ذلك، أصبحت جميع نماذج توليد الصور والفيديو من أحدث عائلة Kandinsky 5.0 —** Video Pro و Video Lite و Image Lite** — متاحة الآن للعامة. توفر هذه النماذج المتقدمة فهمًا أصليًا لمطالبات اللغة الروسية، وتدمج معرفة محددة للسياق الثقافي الروسي، وتقوم على نحو موثوق بتوليد نص سيريلّيكي في كلٍّ من الصور والفيديو. بالإضافة إلى ذلك، تم إصدار نماذج K-VAE 1.0 للترميز وفك الترميز للمحتوى البصري — وهي أمر حاسم لتدريب شبكات توليد المحتوى البصري للذكاء الاصطناعي، ومن بين أفضل النماذج مفتوحة المصدر عالميًا —. تم توزيع الكود والأوزان لجميع هذه النماذج بموجب ترخيص MIT، ما يتيح الاستخدام التجاري.





	**_Andrey Belevtsev، نائب الرئيس الأول، مدير التكنولوجيا والذكاء الاصطناعي، Sberbank:_**



	_“نعتقد أن إنشاء ذكاء اصطناعي عالمي المستوى يتطلب أمرين: موارد ضخمة وفِرَق بحث وتطوير على مستوى عالمي. لدى Sber كلاهما. لكن الأهم هو المشاركة—لا احتكار التكنولوجيا. تتمثل استراتيجيتنا في أن نصبح أساسًا مفتوحًا للابتكار على مستوى البلاد. لذلك نُطلق أوزان النماذج. هذه لحظة محورية. يمكن لأي شركة في روسيا، سواء كانت بنكًا أو شركة ناشئة، تثبيت هذه النماذج ضمن أنظمتها المغلقة، وإجراء ضبطٍ دقيق (fine-tune) لها على مجموعات بيانات داخلية حساسة، والاحتفاظ بالتحكم الكامل في معلوماتها السرية. تعكس هذه المقاربة السيادة التكنولوجية الحقيقية: فالذكاء الاصطناعي ينتمي إلى كامل الأمة، ويقود التحولات في الأعمال والنمو الاقتصادي. وأود أيضًا أن أشير إلى أن Ultra ستكون متاحة قريبًا للعملاء من الشركات، مع تكاليف ملكية مُحسّنة للنشر داخل الشركات.”_



	**GigaChat Ultra وGigaChat Lightning **تتوسع GigaChat مع إضافة GigaChat Ultra Preview وGigaChat Lightning. تبرز GigaChat Ultra Preview بوصفها أكبر وأقوى نموذج في سلسلة GigaChat. يُعد أول نموذج بهذا الحجم في روسيا، على الرغم من أنه ما زال قيد التدريب، إلا أنه يتجاوز زخم المقاييس المرجعية الدولية مثل DeepSeek V3.1 في مؤشرات الجودة الشاملة لأداء اللغة الروسية، ويحتل المركز الأول على معيار MERA. وبالرغم من حجمه، فإنه يحافظ على سرعة لافتة؛ فهو أسرع حاليًا من GigaChat 2 Max، النموذج الرائد السابق.



	نظرًا لأننا نجعل GigaChat Ultra Preview متاحًا مجانًا، يكتسب المطورون القدرة على إجراء ضبط دقيق (fine-tune) للنموذج دون اتصال بالإنترنت. على سبيل المثال، داخل بيئات الشركات الآمنة التي تكون فيها ضوابط خصوصية البيانات الصارمة وجودة البيانات أمرًا حاسمًا.



	يقدم شقيقه، GigaChat Lightning، موازنة معاكسة: حجمٌ مدمج وعملٌ سريع في نموذج MoE مُحسّن للتنفيذ المحلي على أجهزة اللابتوب مع دعم دورات سريعة للتطوير في المنتجات.



	من ناحية الجودة، ينافس GigaChat Lightning عالميًا بين قادة المصادر المفتوحة: فهو يتفوق على Qwen3-4B في مهام اللغة الروسية، ويتطابق مع قدراته الحوارية وتحليل المستندات وحلول تطبيقات الأعمال.



	مثل GigaChat Ultra، ننشر ليس فقط أوزان النموذج بل أيضًا تقنيات تسريع الاستدلال. يتجاوز GigaChat Lightning المنافسين في فئته. يعمل بسرعة قريبة من Qwen3-1.7B رغم أنه أكبر بحجم ست مرات.



	يدمج كلا النموذجين أدوات خارجية بفعالية، مع تسليط الضوء بشكل خاص على ميزتين أساسيتين: الكود والذاكرة.



	• الكود هو أداة لتنفيذ وتحليل وتمثيل عمليات برمجية بصريًا. يتيح تشغيل مقتطفات من الكود، ورسم الرسوم البيانية، وإجراء الحسابات، واختبار الفرضيات في الوقت الفعلي.



	• الذاكرة هي نظام للتواصل الشخصي، يحتفظ بالتفاصيل المهمة مثل الأهداف والتفضيلات وسِجل المحادثات. تقدم النماذج للمستخدمين نصائح شخصية وتعدل المعلومات أثناء الحوارات. يتم حذف البيانات القديمة أو الحساسة تلقائيًا، ويمكن للمستخدمين تعديل ذكريات النموذج يدويًا.



	**GigaAM-v3**



	يمثل GigaAM-v3 خمسة نماذج جديدة مفتوحة المصدر للتعرف التلقائي على الكلام (ASR) مخصصة لمعالجة الكلام الروسية للاستخدام الصناعي وللاستخدام التجاري. يدعم GigaAM-v3 مساعدين صوتيين ومراكز اتصال وتحليلات المكالمات وجامعات رسائل صوتية ووكلاء متعددين الوسائط.



	في النسخة الجديدة من نماذج GigaAM الصوتية، تتدرج أحجام ما قبل التدريب من 50,000 ساعة إلى 700,000 ساعة من الصوت.



	يتيح دعم علامات الترقيم والتطبيع للنموذج المنافسة على قدم المساواة مع OpenAI Whisper، مع تفوقه بشكل كبير في جودة التعرف.





	استنادًا إلى نموذج GigaAM-v3 الأساسي الفريد، يمكن تطبيق أي تقنيات لمعالجة الكلام: في Sber، يتم استخدامه بالفعل للتعرف على الكلام وتوليد الكلام، كما يمكّن GigaChat من معالجة الفيديو والصوت.





	**Kandinsky 5.0**





	Kandinsky 5.0 هو عائلة متعددة الاستخدامات من نماذج توليد المحتوى البصري: يقوم Image Lite بتوليد صور عالية الجودة من نص كمطالبة ويدعم تحرير الصور، بينما يقوم Video Lite وVideo Pro الأكثر تقدمًا بتوليد الفيديو من نصوص المطالبات أو تحريك الصور.





	يولد نموذج **Image Lite** صورًا شديدة التفصيل بدقة HD، ويُظهر فهمًا عميقًا للسياق الثقافي الروسي، ويدعم أصليًا كلاًّ من مطالبات اللغة الروسية والإنجليزية، ويمكنه توليد نص بالحروف اللاتينية والسيريلّية. أما نموذج **Video Pro** فينتج فيديو عالي الدقة يصل إلى 10 ثوانٍ بمعدل 24 إطارًا في الثانية، وهو يتصدر حاليًا بين المصادر المفتوحة عالميًا متجاوزًا Wan-2.2-A14B و محققًا جودة بصرية قابلة للمقارنة مع Veo 3، أحد أقوى النماذج المملوكة عالميًا. وللتكامل السلس في المشاريع التطبيقية، تم إصدار نسخة **Video Lite** وتعديلها بحيث تعمل على وحدات معالجة الرسوم على مستوى المستهلك مع ما لا يقل عن 12 GB من الذاكرة العشوائية.



	أدى تطوير عائلة Kandinsky 5.0 إلى تدريب باستخدام مليار صورة وثلاثمائة مليون فيديو، مدعمة بأكثر من مليون مادة وسائط متعددة إضافية لضمان توافق قوي مع السياق الثقافي المحلي. تطلبت معالجة مجموعات البيانات بهذا الحجم منهجيات على مستوى متقدم، بما في ذلك عدة تقنيات طُورت خصيصًا للمشروع. استخدمت مرحلة التدريب النهائية مجموعة بيانات عالية الجودة أعدّها مصممون وفنانون محترفون لضمان التكوين المثالي والأسلوب والجودة البصرية الشاملة.



	يفتح Kandinsky 5.0 فرصًا جديدة لتطبيقات المستهلك والمؤسسات. يمكن للمطورين والمنظمات الاستفادة من هذه النماذج المتاحة مجانًا لبناء أدوات لتحيات فيديو شخصية، وتحريك الصور، وسرد قصصي بصري غني. يمكن للمتخصصين الإبداعيين، بما في ذلك المخرجون والمصممون والمسوقون وفنانو الرسوم المتحركة، الاعتماد على Kandinsky لتبسيط إنشاء مواد ترويجية ومحتوى رقمي ومشاريع بصرية تجارية. يشير إصدار Kandinsky 5.0 إلى إنجاز بارز في نمو منظومة مفتوحة تتمحور حول تقنيات توليد روسية حديثة، ما يمكّن المستخدمين والشركات من أدوات إبداعية مدفوعة بالذكاء الاصطناعي سهلة الوصول وعالية الجودة.



	**اقرأ المزيد في هذا التقرير.**



	**K-VAE 1.0**

	تُنشئ نماذج التوليد مثل Kandinsky 5.0 محتوى وسائط في مساحات كامنة — غير مرئية للعين البشرية. يتيح العمل على هذه التمثيلات المخفية تدريبًا ونشرًا أسرع وأخف وزنًا وقابلًا للتوسع بشكل كبير. يقدم Sber الآن نماذج autoencoder خاصة مُدربة من الصفر **K-VAE 1.0** للصور (2D) وللفيديوهات (3D) التي تحوّل البيانات البصرية إلى تمثيلات كامنة وتُعيد بنائها مرة أخرى بدقة استثنائية. تُعد نماذج K-VAE 1.0 الأفضل عالميًا بين نظيراتها مفتوحة المصدر. سيؤدي توافرها للعامة إلى رفع تقنيات الذكاء الاصطناعي التوليدي إلى مستوى جديد من الجودة.

MENAFN25112025008487017809ID1110394198
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.24Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.23Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.07%
  • تثبيت