مايكروسوفت وجوجل يطلقان نماذج ذكاء اصطناعي جديدة في نفس اليوم: قدرات الصوت والصورة والمصدر المفتوح المحلي تتنافس معًا

robot
إنشاء الملخص قيد التقدم

أعلنت مايكروسوفت وجوجل يوم الخميس كليهما عن إطلاق نماذج ذكاء اصطناعي جديدة، لكن الفارق بينهما واضح: فالنموذج الذي طرحته مايكروسوفت هو نموذج أساسي جديد يدعى MAI، ولا يتاح إلا عبر منصّتي Azure Foundry وMAI Playground المخصصتين للولايات المتحدة فقط؛ بينما أطلقت جوجل نموذجًا مفتوح المصدر جديدًا بالكامل بعنوان Gemma 4، ويمكن تشغيله محليًا. إضافةً إلى ذلك، غيّرت جوجل ترخيص بروتوكولات هذه النماذج المفتوحة المصدر الجديدة إلى Apache 2.0.

ثلاثة نماذج MAI “عالمية المستوى” من التطوير الذاتي

تتضمن نماذج MAI من التطوير الذاتي التي طرحتها مايكروسوفت، والمصنفة بأنها “عالمية المستوى”، ثلاث حزم:

أولًا: MAI-Transcribe-1، وهو نموذج “متقدم للغاية” لتحويل الصوت إلى نص، يمكنه فهم 25 لغة من اللغات الأكثر استخدامًا عالميًا، كما أن سرعة النسخ الصوتي على نطاق واسع مقارنةً بخطة Azure Fast الحالية لدى مايكروسوفت ترتفع بمقدار 2.5 مرة.

ثانيًا: MAI-Voice-1، وهو نموذج جديد لتوليد الصوت، يمكنه توليد مقطع صوتي مدته 60 ثانية في ثانية واحدة فقط. وفي الوقت نفسه، يدعم أيضًا إنشاء أصوات مخصصة داخل Microsoft Foundry باستخدام عينات صوتية قصيرة.

وأخيرًا: MAI-Image-2، وهو نموذج أسرع لتحويل النص إلى صورة، بدأ بالفعل في الظهور ضمن Copilot، ومن المقرر تطبيقه تدريجيًا على Bing وPowerPoint.

تقول مايكروسوفت:

“نحن نعمل على نشر هذه النماذج الرائدة بسرعة، من أجل دعم منتجاتنا الاستهلاكية والتجارية. قريبًا، ستشاهد مزيدًا من النماذج في Foundry وفي مختلف منتجات وتجارب مايكروسوفت.”

نموذج Gemma 4 مفتوح المصدر من جوجل

يعتمد نموذج Gemma 4 مفتوح المصدر الذي طرحته جوجل ترخيص Apache 2.0، بدلًا من استخدام اتفاقية ترخيص Gemma المخصصة التي كانت مستخدمة سابقًا. وتقول جوجل إن هذه النماذج تمتلك قدرات استدلال متقدمة، وسير عمل قائم على الوكلاء، وتوليدًا للكود، وقدرات توليد للصور والصوت، وتأتي بأربع نسخ مختلفة، مُحسّنة للتشغيل محليًا، وحتى أنها يمكن أن تعمل على “مئات الملايين من أجهزة أندرويد”.

تقول جوجل:

“إن Gemma 4 مبنية على نفس أبحاث وتقنيات عالمية المستوى مثل Gemini 3، وهي حاليًا واحدة من أقوى سلاسل النماذج التي يمكنك تشغيلها محليًا على عتادك. وهي تكمل نماذج Gemini الخاصة بنا، لتزويد المطورين بمزيج من أقوى أدوات المصادر المفتوحة والمملوكة في الصناعة.”

أما نسختا Gemma 4 الأكبر حجمًا (26B و31B)، فتهدفان إلى العمل على وحدات معالجة رسومية (GPU) استهلاكية، ويمكن استخدامها لتشغيل IDE ومساعدات البرمجة وسير عمل قائم على الوكلاء. بينما تركز النسخ الأخف E2B وE4B بشكل أكبر على قدرات الوسائط المتعددة ومعالجة منخفضة الكمون، ومناسبة للأجهزة المحمولة وإنترنت الأشياء (بما في ذلك Raspberry Pi). كما تدعم هذه النماذج التشغيل دون اتصال بالإنترنت بالكامل.

يمكن تنزيل نماذج Gemma 4 مفتوحة المصدر من جوجل على منصات متعددة، بما في ذلك Hugging Face وKaggle وOllama. وتؤكد جوجل:

“تلتزم هذه النماذج، فيما يتعلق بأمن البنية التحتية، بنفس بروتوكولات الأمان الصارمة التي تتبعها نماذجنا المملوكة.”

مزيد من الأخبار، مستمر في التحديث

تنبيه بالمخاطر وإخلاء مسؤولية

        توجد مخاطر في السوق، لذا يُنصح بالحذر عند الاستثمار. لا يشكّل هذا المقال نصيحة استثمارية شخصية، ولم يأخذ في الحسبان الأهداف الاستثمارية الخاصة التي قد يتمتع بها مستخدمون بعينهم، ولا الحالة المالية، ولا الاحتياجات. ينبغي على المستخدم النظر فيما إذا كانت أي آراء أو وجهات نظر أو استنتاجات واردة في هذا المقال تتوافق مع ظروفه المحددة. وبناءً على ذلك الاستثمار، تتحمل المسؤولية كاملة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.23Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:2
    0.24%
  • القيمة السوقية:$2.23Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.22Kعدد الحائزين:1
    0.00%
  • تثبيت