محادثة مؤسس Chance AI: رؤية طريق آخر للعالم، والخروج من جدران "توحيد النماذج الكبيرة"

في منافسة الذكاء الاصطناعي واسعة النطاق التي لا مثيل لها في الوقت الحالي، أصبحت «نماذج كبيرة» هي الإجابة الافتراضية لدى جميع الشركات. الجميع يقومون بترقية القدرة الحاسوبية، والتنافس على الجوائز، والاستحواذ على مختلف نقاط الدخول. ومع ذلك، بينما يتزايد تقارب سرد الصناعة أكثر فأكثر، ظهرت شركة ناشئة تكاد تنفي جميع الممارسات السائدة تقريبًا—Chance AI.

قام المؤسس زeng شي(曾熙)بحذف مربع الإدخال من الصفحة الرئيسية، وأنشأ تطبيق ذكاء اصطناعي لا يتطلب منك طرح الأسئلة؛ يكفي أن ترفع يدك وتصفّق مرة واحدة، ليحلّل لك أي شيء تراه عبر تفسيره نصيًا، وهذا أكثر توافقًا مع الحدس.

في الموقع، استخدم زeng شي صورة لزوج من الأحذية Air Jordan 1، وأخبرنا Chance AI أنها تساوي 300 ألف دولار، لماذا؟ لأنها نفس الزوج الذي كان يرتديه في نهائي بطولة جوردان في ذلك العام؛ كما يمكنه أن يساعد الفتيات في كشف تنسيق الملابس. التقطي سيلفي قبل الخروج، ويمكن للتطبيق أن يخبرها بأن هذا التنسيق—إذا تم تبديل لون وشاح لفّته، أو إضافة حقيبة بلون ما آخر—قد يصبح أعلى توافقًا.

بعد أن لاقت استحسانًا بين طلاب الجامعات في أمريكا الشمالية بسرعة، اتجه الفريق أيضًا إلى صدى صائت لدى الجيل الأصغر، فطوّر سلسلة من الوظائف مثل تقييم OOTD (ملابس اليوم/لباس يومي)، وقراءة الكف، وفحص نوع البشرة، وتعليقات لاذعة وغيرها.

وليس الاكتفاء بتفسير الصور فحسب؛ يمكن للمستخدم أيضًا مشاركة ذلك بنقرة واحدة داخل مجتمع Chance AI المدمج، فصار «ما تراه» مادة حديث خاصة بالمستخدم، واجتمع أيضًا مجموعة من الشباب الذين تتراوح أعمارهم بين 18 و25 عامًا حول ذلك.

صرّح كبير مسؤولي التقنية وو شياوفانغ(吴晓凡)لـ Hu Wall Street Insights بأن Chance AI قد جذبت حوالي 250 ألف مستخدم عالميًا.

ومن ثم، تشكّلت تدريجيًا صيغة شبيهة بـ Google Lens plus Xiaohongshu وInstagram، وجمعت Chance AI مبدئيًا عناصر المنتج الرائج. والأهم أن الشباب كلما استخدموه أكثر، كان ذلك أكثر قدرة على التقاط احتياجاتهم الحقيقية، وقال زeng شي: «لدينا نحو 200 ألف مستخدم من الفئة العمرية في أواخر العشرينات، وبمتوسط كل فتاة في أمريكا الشمالية تلتقط صور ملابسها 2.8 مرة يوميًا—كمية البيانات هذه ما أرهَبَها».

رغم وجود كنز ثري يطمح إليه العمالقة وشركات التجارة الإلكترونية، إلا أن زeng شي وفريقه لم يتعجلوا تحقيق الأرباح، ولا ينوون أيضًا ملاحقة موجة الأجهزة الخاصة بالذكاء الاصطناعي التي تتصدر الترند حاليًا بشكل أعمى؛ وحتى أنهم مؤقتًا لا يملكون الشجاعة لإطلاق حملة ترويجية أكبر حجمًا، خوفًا من أن البنية التحتية قد لا تتحمل في الوقت نفسه «الأموال الغزيرة كالمطر الوابل».

كان هدفهم هو مواصلة تحسين وكيلهم البصري (visual agent)، وتطوير «دماغ بصري» أقوى، ومن ثم تراكم بيانات أغنى، وتكوين مجتمع بصري، لتسريع بدء «تدحرج كرة الثلج».

في ظل تزايد تجانس منتجات الذكاء الاصطناعي، أصبح زeng شي من القلة التي هربت من السرد السائد، لكنه حفَر في الوقت نفسه إجماعًا ينبع من حدس الإنسان: إذا كان لدى الإنسان 70% من عرض حزمة الدماغ لمعالجة البصر، فإن بوابة مستقبل الذكاء الاصطناعي لا ينبغي أن تظل محتكرة بواسطة مربع إدخال واحد.

قد تكون خيارات Chance AI جريئة، لكن في ساحة تتزايد فيها المنافسة حدّ الاختناق، فإن الندرة تجعلها—على العكس—أكثر جدارة بالملاحظة.

إعادة التفاعل إلى الغريزة البصرية

عندما يكون القطاع قد اعتاد تعريف حدود المنتج عبر أسلوب «يقوم الإنسان بطرح سؤال، ويجيب الذكاء الاصطناعي»، طرح زeng شي، مؤسس Chance AI، على Hu Wall Street Insights سؤالًا: «لماذا لا توجد العينان في المؤخرة؟»

لأن منطق التطور لدى البشر يجعل الرؤية مبدأً أوليًا، بينما اللغة ليست سوى نظام ترميز ظهر لاحقًا.

ذكر زeng شي أنه من زاوية التطور، يرتبط نحو 70% من معالجة المعلومات في دماغ الإنسان بالرؤية—فحتى قبل ظهور اللغة، كان الإنسان يعتمد على البصر للتعرّف على البيئة، وتقدير المخاطر والفرص.

على مدار العقد الماضي، تم توحيد جميع أساليب التفاعل السائدة تقريبًا عبر مربع الإدخال. يُفترض على المستخدم أن يعرف مسبقًا ما هو السؤال، وأن يقوم بتحويل الاحتياج إلى لغة، ثم يسلم اللغة إلى نموذج.

بالنسبة لمعظم الناس، هذه الطريقة ليست طبيعية. عندما يرى الشخص في الشارع مبنى غريبًا، أو فنًا غير مألوف، أو رمزًا ضبابيًا، تكون أول استجابة له هي «الانجذاب»، بينما لا يظهر السؤال إلا بعد انقضاء انتباهه.

قال زeng شي: «عبارات التوجيه مخصصة لذكاء اصطناعي كسول.»

لم يكن يقصد مهاجمة بيئة الـ prompt، بل كان يرى أن معظم الوقت يكون الـ prompt هو ما يقوم فيه الإنسان بعمل الذكاء الاصطناعي، ويكمل سلسلة الاستدلال الناقصة لدى النموذج. إذا كان الذكاء الاصطناعي ذكيًا حقًا، فلا ينبغي أن يعتمد على البشر ليعلّموه «كيف يسأل»، بل يجب أن يكون قادرًا على فهم تركيز المستخدم تلقائيًا عبر الإشارات البصرية.

حكى زeng شي لِـ Hu Wall Street Insights قصة. قال إنه من عشّاق الفن، وفي السنتين الماضيتين صنع بنفسه برنامجًا صغيرًا يقوم بمسح المقتنيات وتقديم شرح بمساعدة الذكاء الاصطناعي من أجل إقامة معرض. غير أنه بعد انتهاء المعرض وإزالة اللوحات، اكتشف زeng شي أن أكثر من 1500 شخص ما زالوا يستخدمون ذلك البرنامج الصغير. وبعد إجراء بحث، وجد أن المستخدمين طوّروا لديهم ذاكرة عضلية يستخدمونها لمسح مختلف الزهور والأعشاب والأفلام والملابس، ثم يستمرون في الدردشة مع الذكاء الاصطناعي.

في الواقع، لدى زeng شي إحساس قوي جدًا بالمسؤولية تجاه مصمم. «مهمتنا هي إزالة الفجوة بين التكنولوجيا والإنسان. قد يبدو الذكاء الاصطناعي لدى كثيرين نوعًا من «البرود»، لكن هدفي هو جعله أكثر طبيعية، وأكثر التصاقًا بالاحتياجات الغريزية لدى البشر—فهم واستكشاف العالم عبر البصر.»

وبناءً على هذا الحكم، تم تحديد شكل المنتج مباشرة. منذ اليوم الأول، نقل Chance AI مربع الإدخال بعيدًا عن الواجهة الأساسية.

«الرؤية» أصبحت الفعل الافتراضي، و«السؤال» صار خيارًا. لا يحتاج المستخدم إلى تنظيم اللغة، ولا إلى بناء سؤال مسبق، ولا إلى بذل جهد للعثور على «طريقة السؤال التي يحبها الذكاء الاصطناعي». وفي وقت يكون فيه ما يقرب من الجميع في الصناعة يعززون التفاعل اللغوي، تبدو هذه الخطوة معاكسة تمامًا للاتجاه.

لكن لهذا السبب تحديدًا، تَتَجنّب الشركة الناشئة غالبية المسار الذي تزاحم فيه النماذج. مربع الإدخال يمثل الغاية، بينما البصر يمثل الفطرة؛ مربع الإدخال يركز على حل المشكلات، بينما البصر يركز على إثارة الفضول. يمكن القول إن أسلوب تفاعل Chance AI لا يشبه الأداة بقدر ما يشبه تدريبًا على تنمية «عضلات الإدراك».

مع ذلك، يتحمل السابقون أيضًا المخاطر. في الوقت الحالي، أنشأت الصناعة بالفعل مسارًا كاملاً للمستخدمين في التفاعل عبر اللغة؛ من البحث إلى التجارة الإلكترونية ثم إلى وضع المساعد، وتم تدريب المستخدمين على الاعتماد المتزايد على «طرح الأسئلة».

لا توجد إجابة مؤكدة عما إذا كان البصر سيتحول حقًا إلى بوابة جديدة، ولا تزال هيئة الأجهزة غير ناضجة. لكن ضمن ساحة تنافسية موحّدة للغاية، تحاول Chance AI على الأقل جعل الأسئلة أكثر انفتاحًا مجددًا، بدل الاستمرار في ضغط التفاعل في إطار واحد مع الجميع.

من التعرف إلى الاستدلال حول المعنى

موضع الاختلاف الحقيقي لدى Chance AI عن غيرها لا يكمن في أنها تستخدم كاميرا، بل في أنها تعتبر «تفسير المعنى» قدرة جوهرية للذكاء الاصطناعي.

قال زeng شي إن إلهامه لتأسيس Chance AI يعود إلى طفولته حين شاهد لوحة «الموناليزا» مرة واحدة. «عندما وقفت أمامها—حجمها أصغر بكثير مما كنت أتخيل—كنت ممتلئًا بالترقّب لكنني لم أكن أفهم معنى ما فيها تمامًا. قلت في نفسي: «إنها ليست سوى لوحة صغيرة، ما الذي فيها يثير الإعجاب؟»، ثم نظرت بسرعة ومضيت.»

«الإنسان كائن بصري، وكائن للقصص؛ بطبيعتنا ننجذب إلى ما أمامنا، لكن ما يوقظنا حقًا هو القصة الكامنة وراء ذلك». لاحقًا، عندما سنحت لزeng شي فرصة التعرف بعمق على القصة وراء دافنشي وتلك اللوحة، فهم أخيرًا لماذا تُعد كنزًا من كنوز الحضارة الإنسانية.

قال زeng شي إن مهمة Chance AI هي استخدام التكنولوجيا لمساعدة الناس على اكتشاف هذه القصص الخفية، وإزالة الحاجز بين الإنسان والعالم. أما بالنسبة لاسم «Chance»، فإنه لا يمثل فقط «الفرصة»، بل يمثل أيضًا «العَرَضِيّة» (contingency).

في نظره، تعتمد عملية التطور الحيوي على العَرَضِيّة، وغالبًا ما تنبع ولادة المعرفة والإبداع لدى البشر من هذه الاصطدامات العَرَضية. يأمل Chance AI في تسريع التقاء هذه المعرفة من خلال ربط البصر بالقصص، بحيث تصبح كل تجربة بصرية أعمق وأكثر معنى.

عند النظر إلى الوراء، فقد شهد الاتجاه متعدد الوسائط تقدّمًا كبيرًا في الصناعة خلال العام الماضي؛ وأصبح التعرف على الصور ووضع العلامات ووصفها لدى النماذج السائدة أدق وأدق. ومع ذلك، يرى زeng شي أن جميع هذه القدرات لديها تقريبًا سقفٌ مشترك: يمكنها شرح «ما هو الشيء»، لكنها صعبة عليها المضي خطوة أبعد لتفسير «لماذا هو مهم».

فهم البشر للعالم لم يتوقف أبدًا عند مستوى الحقائق. سواء كان الأمر يتعلق بشرح الأفلام أو تعليق المباريات أو جولات السفر الإرشادية أو الشرح الفني، فإن حاجتنا إلى هذه الأدوار تأتي لأنّها تساعدنا على تحويل الحقائق إلى معنى، وضغط المعلومات إلى قصص، وربط ما نراه بالمنظومات الثقافية الأكبر. وبهذا المعنى، فإن البصر هو شكل من أشكال الاستدلال.

اتخذ منتج Chance AI هنا خيارًا واضحًا. فهو لا يكتفي بتقديم وصف موضوعي، بل يحاول استدعاء الخلفية المعرفية للشيء، والسياق الثقافي، والإجماع الاجتماعي.

أعطى زeng شي مثالًا لِـ Hu Wall Street Insights: لم يعد الحجر مجرد «كتلة صخرية موضوعة فوق الخرسانة»، بل صار LevitatedMass في LACMA في لوس أنجلوس، وهو فن عام تم نقلُه بتكلفة 13 مليونًا و300 ألف دولار، وهو استعارة عن البنية الطبقية لمدن أمريكا. ولم تعد بناية مجرد «ناطحة سحاب مستقبلية»، بل واحدة من أعمال زها حديد الأخيرة، وهي رمز لزهرة البهجة (البنغك/البستان) وهي في مرحلة التبرعم.

هذا النوع من التفسير لا يتم توليده تلقائيًا من النموذج فحسب، بل هو نوع من الاستدلال المعنوي المباشر/الإرادي. شرطه هو أن النموذج مستعد للتدخل، ومستعد للتفسير، ومستعد لتحمل قدرًا من المخاطر الذاتية. وهذا بالضبط ما لا يرغب النموذج السائد في فعله.

يرى العاملون في المجال أن استراتيجيات نماذج الشركات الكبرى شديدة التحفظ، وتميل إلى تقديم معلومات آمنة وموحّدة وخالية من الخلافات؛ بينما يعني التفسير بذاته الذاتية، كما يعني الخلاف، وهذا يزيد المخاطر بالنسبة للمنتجات التجارية الكبيرة.

ولهذا السبب ظل «الاستدلال حول المعنى» منطقة رمادية في الصناعة. كون الشركات الكبيرة لا تقوم به لا يعني أنها غير قادرة على القيام به؛ بل إن القيام به قد يزيد التكاليف. يمنح تحديد Chance AI موقعًا يسمح لها بتحمل «التفسيرات غير المؤكدة» هذه، ويمكّنها من المضي في مسار «الفهم البصري» أبعد من غيرها.

لكن حدود هذا الأسلوب واضحة أيضًا. قد ينحرف السياق الثقافي، وقد يتحول سرد المعنى إلى نوع جديد من «العرافة بالذكاء الاصطناعي». كلما اقترب النموذج أكثر من «التفسير»، احتاج أكثر إلى إيجاد توازن بين العمق والدقة. بالنسبة للشركات الكبرى، هذه مخاطرة لا يمكن خوضها؛ أما بالنسبة لـ Chance، فهذا حدّ لا بد من تحمّله.

لكن لأن Chance تقف في المنطقة التي لا ترغب العمالقة في الاقتراب منها، فإن لديها نافذة زمنية نادرة. إن ما تحاول الإجابة عليه هو: «هل يمكن للذكاء الاصطناعي تعزيز قدرة الإنسان على الفهم». وقد أصابت بالفعل احتياجًا حقيقيًا لدى شريحة من الناس: في عالم يغمره فائض من المعلومات، تكون عملية الحكم/التقدير أكثر ندرة من الإجابات، ويكون الفهم أهم من السرعة.

مشكلة Chance AI تكمن في أن مسارها يحتاج إلى صبر، وإلى نظام بيئي، وإلى أجهزة، وإلى انتقال عادات ثقافية. تكمن قوتها في أنها أدركت في وقت أبكر من غيرها أن التغيير التالي لبوابة الذكاء الاصطناعي قد يحدث في الرؤية.

في عصر يراهن فيه جميع الشركات على نماذج اللغة، يبدو هذا الحكم وحيدًا، لكنه لذلك جدير بأن يُسجل.

تنبيه المخاطر وبنود الإخلاء من المسؤولية

        يوجد خطر في السوق، وتُعد استثمارًا بحذر. لا تشكل هذه المقالة نصيحة استثمارية شخصية، ولم تأخذ في الاعتبار أهداف استثمارية خاصة للمستخدمين الأفراد أو أوضاعهم المالية أو احتياجاتهم. يجب على المستخدمين تقييم ما إذا كانت أي آراء أو وجهات نظر أو استنتاجات واردة في هذه المقالة تتوافق مع حالتهم المحددة. وبناءً على ذلك الاستثمار، تقع المسؤولية على عاتق المستخدم وحده.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.26Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.41Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • تثبيت