يقوم "بيرسيبترون" بتحويل النطاق الترددي الخامل إلى بيانات تدريب للذكاء الاصطناعي

يواجه قطاع الذكاء الاصطناعي حاليًا عنق زجاجة حادًا في بيانات التدريب، خاصة مع قيام احتكارات التكنولوجيا المركزية بإقصاء المطورين في المراحل المبكرة عن خطوط أنابيب المعلومات عالية الجودة. تحاول منصة بيانات البنية التحتية اللامركزية Perceptron معالجة عنق الزجاجة الهيكلي هذا من خلال نشر طبقة بنية تحتية لامركزية تجمع معلومات الويب من خلال أجهزة المستخدمين اليومية.

ملخص

  • تستخدم Perceptron عرض النطاق الترددي الاستهلاكي الخامل لجمع بيانات الويب المتاحة للجمهور وتوفير مجموعات بيانات تدريب الذكاء الاصطناعي منخفضة التكلفة.
  • تقول المنصة إن شبكتها تمتد لأكثر من 150 دولة وتكافئ المساهمين مع التحقق من جودة البيانات قبل توريدها لعملاء المؤسسات.
  • أطلقت Perceptron صندوقًا لبيانات الذكاء الاصطناعي بقيمة 10 ملايين دولار لمساعدة المطورين على الوصول إلى البنية التحتية للبيانات وتسريع تطوير نماذج الذكاء الاصطناعي.

تركز وسائل الإعلام الحديثة بشكل كامل على إبراز كيف تقوم الأسماء الرائدة في مجال الذكاء الاصطناعي باستمرار بنشر أنظمة أجهزة من الجيل التالي لتعزيز قوتها الحاسوبية الخام. لكن أحد القيود التشغيلية التي لا يتم الحديث عنها كثيرًا هو جودة بيانات التدريب التي تشكل الأساس الأساسي لأي نموذج ذكاء اصطناعي فعال.

المشكلة هي أنه مع حصاد الغالبية العظمى من محتوى الويب المفتوح بالكامل بالفعل، أدى السيطرة المؤسسية العدوانية على واجهات برمجة التطبيقات العامة إلى حبس الأسس المتبقية لجمع مجموعات البيانات خلف جدران دفع باهظة التكلفة بملايين الدولارات. لقد أصبح بشكل أساسي امتيازًا حصريًا باهظ التكلفة لحفنة من الاحتكارات التكنولوجية الضخمة.

بالنسبة لعمالقة التكنولوجيا الذين يقودون حاليًا سباق الذكاء الاصطناعي، فإن تأمين خطوط أنابيب المعلومات عالية التكلفة هذه ليس تحديًا ماليًا كبيرًا، ولكن ماذا عن المبتكرين الذين يعانون من نقص التمويل؟ بدون الميزانيات اللازمة، تجد الشركات الناشئة في المراحل المبكرة نفسها تكافح لبناء منتجات تنافسية.

"تدفع OpenAI ما يقرب من 60 مليون دولار إلى 100 مليون دولار سنويًا لشركات مثل Reddit وTwitter لتتمكن من الوصول إلى البيانات عبر واجهات برمجة التطبيقات"، قال بيتر أنتوني، المؤسس المشارك والرئيس التنفيذي لشركة Perceptron، لـ crypto.news خلال مقابلة حديثة.

"العديد من مشاريع الذكاء الاصطناعي الجديدة ليس لديها ميزانيات لتكون قادرة على إنفاق 60 مليون دولار إلى 100 مليون دولار لتتمكن من الوصول إلى البيانات. إذا قمت ببناء أفضل نموذج في العالم، فهو عديم الفائدة إلى حد كبير إذا لم يكن لديه إمكانية الوصول إلى بيانات عالية الجودة. يمكنك أن تكون أذكى طفل في المدرسة، ولكن إذا لم تتمكن من الوصول إلى أي كتب، فليس لديك حقًا الكثير من المعلومات لتقديمها."

أدرك أنتوني أن هذا التباين في السوق يترك مجالًا لبنية تحتية بديلة تخدم شريحة السوق المستقلة، مما قاده في النهاية إلى المشاركة في تأسيس Perceptron، وهي منصة تخطط لاستخدام عرض النطاق الترددي الاستهلاكي الخامل لحل "مشكلة عنق الزجاجة في البيانات" التي يعاني منها الذكاء الاصطناعي حاليًا.

"لقد تم بالفعل الوصول إلى غالبية بيانات العالم وكشطها، ولكن هناك الكثير من البيانات المخبأة نوعًا ما خلف أماكن مختلفة لا يمكن الوصول إليها بعد، لذلك نقوم بجمع البيانات ووضع أنفسنا في موقع يسمح لنا بتوفير البيانات لشركات الذكاء الاصطناعي بتكلفة مخفضة"، أوضح أنتوني.

حصاد عرض النطاق الترددي الخامل

ولكن ما هو عرض النطاق الترددي الخامل الذي تخطط Perceptron للاستفادة منه؟ أوضح أنتوني أن هذا هو الأصل الاقتصادي غير المعترف به الذي ينتجه المستخدمون العاديون باستمرار من خلال التصفح الرقمي الروتيني، فقط ليشاهدوا الشركات الكبرى تستخرجه وتحقق أرباحًا منه.

"حاليًا، في كل مرة تستخدم أنا وأنت الإنترنت على هواتفنا أو أجهزة الكمبيوتر الخاصة بنا، فإننا نولد بيانات. يتم جمع هذه البيانات، وتجميعها في مجموعات بيانات ضخمة بواسطة شركات مثل Google، وبيعها بملايين، وأحيانًا مليارات الدولارات. ومع ذلك، أنا وأنت لا نرى أبدًا سنتًا واحدًا من تلك القيمة."

ما فعلته Perceptron هو قلب هذا النموذج الاستخراجي رأسًا على عقب تمامًا. لقد بنوا شبكة تمتد لأكثر من 150 دولة تضم ما يقرب من 800,000 عقدة، ويتم تشغيل هذه العقد بواسطة مستخدمين فرديين يقومون ببساطة بتشغيل ملحق متصفح على Chrome أو تطبيق على أجهزة Android الخاصة بهم.

لا تقوم هذه التثبيتات الطرفية بكشط الملفات الرقمية الخاصة أو توفير القياس عن بعد الشخصي الحساس للشركة، بل تؤمن بدلاً من ذلك وجهات نظر جغرافية محلية، وصفها أنتوني بأنها "زوايا مشاهدة مختلفة" على الويب المفتوح، والتي يمكن بعد ذلك استخراجها في أجزاء صغيرة ودمجها في مجموعة بيانات واحدة ذات معنى.

"من المهم جدًا أن نركز على حقيقة أنها لا تستخدم بيانات الأفراد، ولا تتنصت على بياناتك ومعلوماتك الشخصية، ولكن لنفترض أنك الآن في ملاوي. عندما تنظر إلى موقع ويب معين، يمكنني الذهاب والنظر إلى نفس الموقع، ولكن من المحتمل، لأنني في دبي، أننا سنرى مجموعة مختلفة من النتائج. كل ما نكسبه من هذا الموقف هو القدرة على استخدام جهاز الكمبيوتر الخاص بك للنظر إلى شيء مثل صفحة ويب عادية، أو أيًا كان."

للتوضيح، أشار أنتوني إلى أنه إذا كان عميل مؤسسي يحتاج إلى مجموعة بيانات من منشورات وسائل التواصل الاجتماعي المتعلقة بالرعاية الصحية من الولايات المتحدة، يمكن لـ Perceptron التنسيق عبر شبكة العقد العالمية الخاصة بها لاستخراج المنشورات العامة الفردية دون التفاعل مع واجهات برمجة تطبيقات المؤسسات المقيدة.

نظرًا لأن هذه البيانات متاحة بالفعل بحرية للجمهور عبر أي متصفح ويب قياسي، فإن توجيه التجميع عبر عقد طرفية فردية يتجاوز قانونيًا جدران الدفع التجارية. بمجرد استرداد حزم البيانات الصغيرة هذه، تقوم الشبكة بنقل البيانات غير المكررة مرة أخرى إلى خادم مركزي حيث تقوم نماذج الذكاء الاصطناعي المتخصصة بتنظيف ومراجعة المعلومات لمراقبة الجودة.

"من خلال القيام بذلك، يمكننا خفض التكلفة بشكل كبير التي يتم فرضها حاليًا من قبل العديد من الشركات المركزية الكبيرة مثل Google."

مدعومة بحلقة اقتصادية تحفز المشاركين في الشبكة ذوي الجودة

السؤال التالي هو لماذا يتطوع أي شخص بأجهزته لشبكة كهذه، والإجابة واضحة، حلقة قيمة مشتركة تضمن أن هذه العقد تكسب نقاطًا مقابل اتصالها السلبي المقرر تحويلها إلى رموز مشفرة أصلية في المستقبل.

وفقًا لأنتوني، فإن هذا النموذج الموزع "سيمكنهم من كسب النقاط" التي تعمل كمقياس مباشر لمساهمتهم في الشبكة، وبالتالي "عندما يتم تحقيق إيرادات من قبل الشركة، سيتم إعادة تغذية الرموز المميزة في النظام البيئي" للحفاظ على حلقة اقتصادية دورية.

"سيكون هناك أيضًا رموز مميزة يتم تخصيصها تستخدم لإعادة شراء الرموز المميزة"، أضاف.

ومع ذلك، ليس كل شخص يدير عقدة مؤهل بشكل أساسي للحصول على مكافآت متسقة، حيث يوجد التحدي الدائم لمراقبة الجودة، والذي يمكن أن يضر بسلامة مجموعة البيانات إذا ترك دون رادع.

تعالج Perceptron ذلك عن طريق توجيه الحزم المجمعة مرة أخرى إلى خادم مركزي، حيث تقوم الخوارزميات الآلية بتقييم المدخلات بشكل منهجي مقابل المعايير المستهدفة قبل إصدار أي تعويض.

علاوة على ذلك، قال أنتوني إن الشركة الناشئة استحوذت مؤخرًا على شركة متخصصة في برامج التحقق من المعاملات والدفع لأتمتة عملية التحقق هذه هيكليًا.

لمزيد من إشراك المشاركين في الشبكة مع دفع إنشاء مجموعات البيانات أيضًا، تخطط Perceptron أيضًا لإطلاق منصة منظمة لـ "البحث عن البيانات" (Data Questing)، والتي ستسمح للمساهمين بتحويل الجهد البشري النشط إلى مدخلات تدريب فريدة.

"نهدف إلى أن نكون قادرين على بناء مجموعات بيانات وإنشاء مجموعات بيانات غير متوفرة حاليًا من خلال العمليات المركزية"، أضاف أنتوني.

الهدف النهائي

على المدى الطويل، قال أنتوني إنه يرغب في رؤية الشبكة تنتقل إلى نموذج يركز على ذكاء الأعمال قادر على توفير تحليلات عميقة لعملاء المؤسسات.

"الفرق هو أن مجموعات البيانات التقليدية ثابتة، يتم جمعها مرة واحدة وسرعان ما تصبح قديمة. ولكن هناك كمية هائلة من البيانات يتم إنشاؤها في كل مرة تتفاعل فيها مع أي شيء عبر الإنترنت، وحاليًا، معظمها يذهب سدى ببساطة"، قال أنتوني.

"خادم واحد يحاول مراقبة كل هؤلاء المستخدمين المختلفين لا يمكنه حقًا جمع معلومات استخباراتية ذات معنى على هذا النطاق. ما نحتاجه هو تحول نحو ذكاء الأعمال الموزع، حتى نتمكن بالفعل من تحسين الخدمات عبر أشياء مثل التجارة الإلكترونية، والتداول، وأكثر من ذلك بكثير."

أطلقت Perceptron أيضًا صندوقًا لبيانات الذكاء الاصطناعي بقيمة 10 ملايين دولار، والذي تتوقع المنصة من خلاله تمويل المطورين المستقلين ودعم نشر "المشاريع الفعلية التي تقدم خدمات حقيقية". بموجب شروط البرنامج، تتلقى فرق الهندسة المختارة خمسة أسابيع من مساعدة البنية التحتية للبيانات المخصصة وما يصل إلى 5 تيرابايت من البيانات الواقعية مجانًا لتسريع تحسين نماذج الذكاء الاصطناعي في المراحل المبكرة.

"الهدف هو دعم المشاريع أثناء نموها وزيادة متطلباتها من البيانات. يمكننا أن نصبح أحد مزوديها الأساسيين، إنه استثمار في النظام البيئي الأوسع وطريقة لنا لبناء إيرادات ثابتة طويلة الأجل"، لاحظ أنتوني.

في وقت النشر، قال أنتوني إن Perceptron تقوم بالفعل بتوريد منتجات بيانات متنوعة بنشاط إلى مجموعة متنوعة من المؤسسات التجارية. توفر الشبكة مجموعات صور واسعة النطاق لمنصات التوليد من النص إلى الفيديو، بما في ذلك شركة تدعى Everlyn AI، لتدريب النماذج على تركيب المحتوى المرئي بدقة.

إلى جانب ذلك، يتجاوز المشروع أيضًا تجميع الصور القياسي، حيث دخلت المنصة في قطاع تحليل المشاعر من خلال تتبع الخطاب العام عبر Twitter وYouTube وأسواق الأصول الرقمية. يساعد تحليل المشاعر العامة هذه شركات العملات المشفرة والبورصات على بناء أدوات تتبع تعطي إشارات مبكرة لاستباق التقلبات المفاجئة في الأسعار.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت