تيثر تطلق ذكاءً اصطناعيًا طبيًا على الجهاز يتفوق على نماذج جوجل في اختبارات الأداء

مجموعة أبحاث الذكاء الاصطناعي في تيثير أصدرت QVAC MedPsy-1.7B و MedPsy-4B، نماذج لغة طبية مخصصة تعتمد على النص فقط، مصممة للعمل مباشرة على أجهزة منخفضة الطاقة مثل الهواتف الذكية والأجهزة القابلة للارتداء.

ووفقًا للفريق، تتفوق هذه النماذج على بعض أنظمة الذكاء الاصطناعي الطبية الكبيرة، بما في ذلك نظام جوجل، في معايير مختلفة، وتؤدي بشكل مماثل للأنظمة الأكبر بكثير في مهام التفكير والمعرفة الطبية مع الحفاظ على التنفيذ المحلي الكامل والخصوصية.

تعتمد أنظمة الذكاء الاصطناعي التقليدية في الرعاية الصحية على نماذج مستضافة على السحابة، تتطلب إرسال بيانات حساسة مثل سجلات المرضى ومدخلات التشخيص إلى خوادم خارجية، مما يخلق مخاطر تتعلق بالخصوصية والامتثال. هذا الهيكل يتعرض لضغوط متزايدة مع توقع نمو قطاع الذكاء الاصطناعي الصحي من حوالي 36 مليار دولار اليوم إلى أكثر من 500 مليار دولار بحلول عام 2033.

يقول فريق تيثير إن QVAC MedPsy يتحدى نموذج التوسع من خلال التركيز على الكفاءة.

النموذج 1.7 مليار مناسب للهواتف الذكية. حقق هذا الإصدار الصغير 62.62 عبر سبعة معايير طبية قياسية، متفوقًا على MedGemma-1.5-4B-it من جوجل بأكثر من 11 نقطة على الرغم من كونه أقل من نصف حجمه، وفقًا للباحثين. كما تفوق على MedGemma 27B في مهام سريرية حقيقية مثل HealthBench Hard.

وصلت نسخة 4B إلى 70.54 في نفس الاختبارات، متفوقة على MedGemma-27B، وهو نموذج أكبر بحوالي سبع مرات. قدم أداء قويًا على HealthBench وHealthBench Hard وMedXpertQA.

تشمل هذه النتائج ثمانية مجموعات معايير، بما في ذلك MedQA وMedMCQA وMMLU Health وPubMedQA وAfriMedQA وMedXpertQA وHealthBench، مدعومة بتدريب طبي تدريجي يجمع بين الإشراف، وبيانات التفكير السريري المختارة، والتعلم المعزز.

“مع QVAC MedPsy، كان تركيزنا على تحسين الكفاءة على مستوى النموذج، بدلاً من زيادة الحجم”، علق المدير التنفيذي لتيثير، باولو أردوينو، على الإصدار.

هذه النماذج ليست ذكية فحسب، بل عملية جدًا، كما لاحظ الباحثون. فهي ترد بسرعة بإجابات قصيرة ولكنها مكتملة، مما يوفر الوقت وعمر البطارية. تتوفر بصيغ مضغوطة سهلة الاستخدام تتناسب بشكل مريح مع الأجهزة المحمولة دون فقدان الكثير من الجودة.

من الناحية التقنية، يولد النموذج 4B استجابات في حوالي 909 رموز، مقارنة بحوالي 2,953 لنظم مماثلة، مما يقلل من الحجم بمقدار 3.2 مرة. أما النموذج 1.7B فينتج حوالي 1,110 رمز مقابل 1,901، مما يقلل الناتج بمقدار 1.7 مرة.

يتم إصدار كلا النموذجين الآن بصيغة GGUF المجدولة، مع نسخ مضغوطة تزن حوالي 1.2 جيجابايت و2.6 جيجابايت على التوالي.

“هذه المجموعة مهمة لأنها تقلل مباشرة من متطلبات الحوسبة، والكمون، والتكلفة. تتيح للنموذج العمل محليًا على أجهزة عادية بدلاً من الاعتماد على البنية التحتية البعيدة”، أضاف أردوينو. “في الرعاية الصحية، يغير ذلك القيود تمامًا؛ يمكنك تشغيل التفكير الطبي حيث توجد البيانات بالفعل، داخل نظام المستشفى أو على جهاز، دون نقل معلومات حساسة عبر السحابة أو الانتظار للمعالجة الخارجية.”

النماذج متاحة الآن مجانًا بموجب ترخيص مفتوح على منصة هاجينج فيس.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت