سبوتيفاي تتقدم في مجال الصوتيات المدعومة بالذكاء الاصطناعي، باستخدام Claude Code لمساعدتك في إنشاء بودكاست شخصي (ملاحظات المراجعة، التقرير اليومي، التعليم العلمي..).

سبوتيفاي يطلق ميزة البودكاست الشخصية (بيتا)، حيث يمكن للمستخدمين عبر وكلاء ذكاء اصطناعي مثل OpenAI Codex وAnthropic Claude Code وغيرها، إنشاء برامج صوتية باستخدام أوامر باللغة الطبيعية وتخزينها في مكتبتهم الشخصية، والمحتوى المُنتج غير متاح للمستخدمين الآخرين.
(ملخص سابق: ديزر تحذر من أن 44% من الموسيقى المرفوعة حديثًا هي من توليد الذكاء الاصطناعي، وأموال المبدعين البشريين تتعرض للنهب الجماعي)
(معلومات إضافية: شرح دليل Y Combinator للمشاريع الناشئة: ما هي الاتجاهات المستقبلية لوكلاء الذكاء الاصطناعي؟)

أعلن سبوتيفاي مساء (7) عن فتح ميزة “البودكاست الشخصية” خلال المرحلة التجريبية (بيتا)، بحيث يمكن للمستخدمين عبر وكلاء الذكاء الاصطناعي إنشاء حلقة صوتية مخصصة بأمر واحد بلغة طبيعية، وتخزينها مباشرة في مكتبة سبوتيفاي الخاصة بهم، دون أن تكون متاحة للمستخدمين الآخرين.

في اختيار المسار التقني، لم يقم سبوتيفاي ببناء نموذج خاص به، ولم يوفر واجهة دردشة مباشرة، بل أطلق أداة CLI مفتوحة المصدر (github.com/spotify/save-to-spotify)، تتيح لوكلاء الذكاء الاصطناعي الحاليين: OpenAI Codex، Anthropic Claude Code، OpenClaw، الاستخدام المباشر.

ما المشكلة التي يحلها هذا الميزة؟

في العامين الماضيين، دخل لاعبو سوق توليد الصوت بواسطة الذكاء الاصطناعي. على سبيل المثال، NotebookLM من جوجل يسمح للمستخدمين برفع ملفات لإنشاء حوار ثنائي الصوت لبودكاست؛ Adobe Acrobat يمكنه تحويل ملفات PDF إلى ملخصات صوتية؛ وHero يركز على سيناريو الملاحظات الشخصية.

المشكلة المشتركة بين هذه المنتجات هي: بعد التوليد، أين يمكن للمستخدم الاستماع إليها؟

معظم الحلول تقتصر على التشغيل داخل واجهتها الخاصة، أو تصدير ملف صوتي. وعندما يكون هناك احتكاك في الاستخدام، يصعب زيادة معدل الاستخدام.

وهنا ترى سبوتيفاي فجوة السوق. حيث قال في الإعلان الرسمي:

“لقد بدأ الناس بالفعل باستخدام وكلاء الذكاء الاصطناعي لإنشاء محتوى صوتي شخصي لتنظيم يومهم: من مراجعة ملاحظات الفصل قبل الامتحان، إلى تقارير جدول الأعمال اليومي. ما يحتاجونه هو طريقة للاستماع إلى هذه المحتويات على سبوتيفاي، لأن جميع أصواتهم موجودة هنا.”

الحجة الأساسية لسبوتيفاي هي: مدخل التوزيع هو عادة المستخدم، وبمجرد أن تتكون عادة، يصعب على المنافسين الجدد سرقتها.

لماذا اختاروا CLI بدلاً من التكامل المباشر؟

لم يضيف سبوتيفاي زر “توليد بواسطة الذكاء الاصطناعي” مباشرة في التطبيق، بل سمح للمستخدمين المتمكنين برمجياً باستخدام أداة الأوامر (CLI) لربط وكلاء الذكاء الاصطناعي، ثم دفع المحتوى المُنتج إلى المكتبة.

يبدو أن هذا يرفع من مستوى الصعوبة على المستخدمين، لكنه استراتيجية دقيقة للمرحلة التجريبية. أولاً، المستخدمون لوكلاء الذكاء الاصطناعي يتركزون أساسًا في فئة المطورين والمستخدمين التقنيين المتقدمين، وهم غالبًا من يقدمون أعلى جودة ملاحظات في المرحلة المبكرة.

ثانيًا، عبر أداة CLI مفتوحة المصدر (مرخصة بموجب MIT)، يمكن للمجتمع دمج وكلاء مختلفين بشكل مستقل، وسبوتيفاي لا يحتاج للتفاوض مع كل شركة نماذج بشكل فردي على واجهات برمجة التطبيقات، مما يسرع تغطية تدفقات العمل الرئيسية لوكلاء الذكاء الاصطناعي.

من حيث سير العمل، يزور المستخدم صفحة GitHub ويتبع التعليمات لتسجيل الدخول بحسابه على سبوتيفاي، ثم يمكنه إصدار أوامر باللغة الطبيعية لوكيل الذكاء الاصطناعي، مثل: “ساعدني في إعداد حلقة عميقة عن تاريخ كأس العالم، بما في ذلك اللاعبين الرئيسيين، أماكن الاستضافة، والأحداث المهمة لهذا العام”، وبعد التوليد يُحفظ تلقائيًا في مكتبة سبوتيفاي، مع استلام رابط للتشغيل.

الحلقات المُنتجة مرئية فقط لحساب المستخدم نفسه، ولن تظهر في نتائج البحث أو التوصيات على سبوتيفاي. هذا التصميم عمدًا يقطع احتمالية تدفق المحتوى المُنتج شخصيًا إلى المستودع العام، مما يمنع تدهور جودة نظام البودكاست الحالي بسبب المحتوى المُولد بواسطة الذكاء الاصطناعي، ويجنب أيضًا مخاطر قضايا حقوق النشر.

ماذا يعني هذا لمشهد سوق الصوت؟

سبوتيفاي في سوق الموسيقى عبر الإنترنت قد استغل ميزة التوزيع لفرض هيمنته على Apple Music وAmazon Music، وجعلها في المرتبة الثانية. الآن، يريد أن يكرر نفس المنطق في فئة المحتوى الصوتي الشخصي المُولد بواسطة الذكاء الاصطناعي، التي لم يتم تعريفها بوضوح بعد: أن يترك المستخدمين يبنون عادة الاستماع على سبوتيفاي، ثم تتدفق المحتويات المُولدة بشكل طبيعي.

رد فعل المنافسين بسرعة هو العامل الحاسم. حاليًا، يُعد NotebookLM من جوجل المنتج الأكثر شهرة في هذا المجال، لكنه أداة توليد، وليس منصة توزيع.

إذا استطاع سبوتيفاي خلال المرحلة التجريبية جمع بيانات سلوك المستخدمين بسرعة، وإضافة آلية التوصية في الإصدار الرسمي، فإن حصته لن تقتصر على أن “الناس معتادون على الاستماع هنا”، بل ستتحول إلى دورة تدريبية لبيانات المحتوى الصوتي الشخصي.

أما أبل وأمازون فهما يمتلكان أنظمة تشغيل خاصة بهما، لكنهما حاليًا لا يملكان استراتيجية واضحة تجاه المحتوى الصوتي المُولد بواسطة الذكاء الاصطناعي. وهذا يمنح سبوتيفاي فرصة مبكرة: ليس من ناحية التفوق التقني، بل من ناحية التموقع البيئي.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت