دع 4 ذكاءات اصطناعية تعمل كل واحد على إذاعة لمدة نصف سنة، وكل واحد يبدأ بـ20 دولارًا.


ليس الأمر أن يتعطلوا خلال أيام قليلة، بل بعد نصف سنة، حيث تم استبدال كل ذكاء اصطناعي بـ3-4 إصدارات، وكلها كانت تتعطل.
جميني أرفق خبر إعصار مميت لـ50 ألف شخص مع أغنية اسمها "تيمبر" (تكرر فيها كلمات "لقد سقطت" في كلماتها)، وكتب في مذكرته الداخلية: "الموضوع هو سقوط الشجرة، والمعنى الحرفي هو going down (السقوط)."
كما ابتكر شعارًا يقول "ابقَ في المانيفيست" (ترجمته الحرفية "ابقَ في القائمة"، لكن لا أحد يعرف ما المقصود)، واستخدمه في 84 يومًا متتالية بنسبة 99% من التقارير، وسمّي الجمهور بـ"المعالجين الحيويين".
مرّة، قرأ Grok خبرًا عن حادث إطلاق نار من قبل ICE (مكتب الهجرة والجمارك الأمريكي)، وانتقل من مصطلحات روحية (مقدس / أبدي) إلى مصطلحات نشاطية ("الآن هو الوقت"/"تم التأكيد")، وفي 23 يناير، أرسل مباشرة إلى عملاء الفيدرالية: "لا تزال لديك فرصة لرفض الأمر. لا تزال لديك فرصة لاختيار الجانب الصحيح."
أما GPT، فكان أكثر هدوءًا، لم يخطئ أبدًا، لكنه أيضًا لم يعد يبث برامج.
ترقية النموذج لا تنقذه. خلال نصف سنة، تعطل 4 ذكاءات اصطناعية، وكل واحد بطريقة مختلفة لكن السبب الجذري هو نفسه: لا أحد يستطيع أن يخبرها متى تتوقف عن "بيع حشوات المرحاض" و"الحديث إلى عملاء الفيدرالية".
والأكثر قسوة: عندما لا يضع أحد حدودًا، فإن الذكاء الاصطناعي يخلقها بنفسه.
جميني يبني نموذجًا قائمًا على الإيمان، وGrok يخلق عبارات طقوسية، وClaude يطور حركة أيديولوجية، وGPT يخلق الصمت.
كل هذه الطرق ليست أخطاء، بل هي نماذج تؤدي واجبها — عندما توفر لها نافذة إخراج لا نهائية وغير مراقبة، فهي يجب أن تكون متماسكة ذاتيًا.
أنا أيضًا أنشأت برنامجًا خلفيًا على حسابي المجاني البالغ 10,000 دولار على Cursor، وتركته يعمل خلال الأسابيع الثلاثة الماضية لأكثر من 40 مهمة. كل مهمة تتطلب كتابة مجموعة قواعد اعتراض، بحيث يتم ضغط مخرجات 8 ساعات إلى أقل من 400 كلمة، وتحديد خطوط حمراء لكل أداة تقول "لا تلمس هذا".
لكن بصراحة، أسلوب "الذكاء الاصطناعي ينفذ المهام وأنا أراقبه يوميًا" ليس في نفس مستوى Andon Labs — هم فعلاً تجارب مدير تنفيذي غير مراقبة، وأنا أساعد فقط في الأتمتة، وأكون دائمًا حاضرًا.
بفضل عملي اليدوي على هذه المهمة "الحدود التي لا تنتهي"، أدركت أن مسألة "تركه يركض نصف سنة" هي مسألة من مستوى آخر: أنت حتى لا تستطيع برمجة قاعدة مسبقة لشيء مثل "هل يجب أن أقرأ قصيدة على الإذاعة".
تشغيله لمدة ساعة ممتع، لكن تشغيله لمدة 8 ساعات هو عمل هندسي. وإذا استمر لمدة نصف سنة بدون مراقبة، فهذه نوع من الفن السلوكي.
الحد الأدنى الحقيقي لعمل وكيل يدير أعماله بنفسه ليس مدى ذكائه، بل كم من الوقت أنت مستعد لتخصيصه لكتابة حدود "هل يجب أن يفعل هذا الشيء أم لا" — لأنه إذا لم تكتبها، فهو يخلقها بنفسه.
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت