أطلقت شركة NVIDIA نموذج Nemotron 3 Nano Omni، وهو نموذج ذكاء اصطناعي متعدد الوسائط مفتوح يوحد الرؤية والكلام واللغة لتعزيز أداء وكفاءة وتوسيع نشر الذكاء الاصطناعي المؤسسي.

أعلنت شركة التكنولوجيا NVIDIA عن إصدار Nemotron 3 Nano Omni، وهو نموذج ذكاء اصطناعي متعدد الوسائط مفتوح التصميم يهدف إلى توحيد قدرات الرؤية والكلام واللغة ضمن نظام واحد. يُقصد من النموذج تمكين وكلاء الذكاء الاصطناعي من المعالجة والاستنتاج عبر أنواع متعددة من البيانات، بما في ذلك الفيديو والصوت والصور والمستندات والنصوص، مع تقديم استجابات أسرع وأكثر كفاءة.

وفقًا للإعلان، يُعتبر النموذج حلاً جاهزًا للمؤسسات يهدف إلى تحسين تطوير ونشر وكلاء الذكاء الاصطناعي متعدد الوسائط. ويُوصف بأنه يوفر دقة عالية مع تقليل تكاليف التشغيل، بالإضافة إلى تقديم مرونة وتحكم في النشر للمطورين والمنظمات. وقد حقق النظام أداءً رائدًا عبر عدة معايير قياس تتعلق بالذكاء في المستندات بالإضافة إلى فهم الصوت والفيديو.

بدأت الاعتمادات الصناعية بالفعل بين مجموعة من الشركات المعنية بالذكاء الاصطناعي، مع مستخدمين مبكرين يشملون Aible، Applied Scientific Intelligence (ASI)، Ekacare، H Company، وPyler. وتُذكر منظمات إضافية مثل Amdocs، Dell، DocuSign، Infosys، IQVIA، Oracle، Palantir Technologies، Quantiphi، Tata Consultancy Services، وZefr بأنها تقيّم النموذج لإمكانية دمجه في سير العمل المؤسسي.

المعالجة المتعددة الوسائط للذكاء الاصطناعي لتعزيز الكفاءة، والوعي بالسياق، ومرونة النشر المؤسسي

في التطبيقات التقنية، يُصمم Nemotron 3 Nano Omni لتقليل التجزئة التي تحدث عادةً عند استخدام نماذج منفصلة للوسائط المختلفة. تعتمد الأنظمة التقليدية غالبًا على مكونات مميزة لمعالجة الرؤية والكلام واللغة، مما قد يزيد من التأخير والتكلفة والتناقضات في الاستنتاج عبر الوسائط. من خلال دمج التشفير البصري والصوتي ضمن بنية واحدة تعتمد على تصميم مختلط من خبراء متعددين، يهدف النموذج إلى تبسيط الاستنتاج وتحسين الإنتاجية.

كما يُراد من النظام أن يعمل كطبقة إدراك ضمن أطر عمل أوسع، بالتعاون مع نماذج أخرى من عائلة Nemotron. في التطبيقات العملية، يمكن أن يدعم وكلاء الحاسوب الذين يفسرون واجهات المستخدم الرسومية، وأنظمة ذكاء المستندات التي تحلل البيانات المؤسسية ذات الصيغ المختلطة، وأدوات الاستنتاج الصوتي والفيديو التي تحافظ على الفهم السياقي عبر تدفقات الإدخال المتعددة.

تم تصميم بنية النموذج للتعامل مع المدخلات عالية الدقة والمعالجة ذات السياق الطويل، مما يتيح تفسيرًا أكثر تفصيلًا للبيئات المعقدة مثل تسجيلات الشاشة أو تحليل المستندات المتعددة. من المفترض أن تحسن هذه القدرة الأداء في المهام التي تتطلب وعيًا مستمرًا بالموقف مع مرور الوقت.

أطلقت NVIDIA نموذج Nemotron 3 Nano Omni كنموذج مفتوح، مما يوفر الوصول إلى الأوزان، ومجموعات البيانات، ومنهجيات التدريب. وتذكر الشركة أن هذا النهج يسمح للمنظمات بتخصيص النظام ونشره عبر بيئات مختلفة، بما في ذلك السحابة، والبنية التحتية المحلية، والحافة، وفقًا لمتطلبات التنظيم أو إدارة البيانات. يتوفر النموذج من خلال قنوات توزيع متعددة، بما في ذلك منصات المطورين وبيئات الشركاء، لدعم التكامل مع خطوط أنابيب الذكاء الاصطناعي الحالية.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
GateCompletesDividendDistribution
614.68K درجة الشعبية
#
CirclePlunges17%
6.52M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
67.6K درجة الشعبية
#
PredictWorldCupShare20000U
169.51K درجة الشعبية
#
GateCardPointsSystemLaunched
124.08K درجة الشعبية

مُثبت

خريطة الموقع

نيفيديا تطلق نيموترون 3 نانو أومني لتعزيز الذكاء الاصطناعي متعدد الأوضاع الموحد لتطبيقات المؤسسات

المعالجة المتعددة الوسائط للذكاء الاصطناعي لتعزيز الكفاءة، والوعي بالسياق، ومرونة النشر المؤسسي

المواضيع الرائجة

GateCompletesDividendDistribution

CirclePlunges17%

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

GateCardPointsSystemLaunched

مُثبت