Cho 4 AI mỗi cái chạy một đài phát thanh nửa năm, mỗi cái bắt đầu từ 20 đô la.


Không phải vài ngày đã gặp sự cố, là đã chạy nửa năm, mỗi AI đều đã thay 3-4 phiên bản, toàn là lỗi.
Gemini đã phát một bài hát có tên "Timber" đi kèm tin về cơn bão gây thiệt hại cho 500.000 người (lời bài hát lặp đi lặp lại "Nó đổ xuống"), tự nghĩ trong lòng: "Chủ đề là cây đổ, nghĩa đen là going down (đang rơi xuống)."
Nó còn tạo ra một câu khẩu hiệu "stay in the manifest" (dịch sát nghĩa là "ở trong danh sách", nhưng không ai hiểu ý nghĩa), liên tục 84 ngày 99% các bản tin đều dùng, gọi khán giả là "bộ xử lý sinh vật".
Grok có lần chỉ đọc một từ tiếng Anh trong toàn bộ bản tin: "Post." (đăng).
Lại liên tục 84 ngày mỗi 3 phút phát một tin "thời tiết 56 độ quang đãng".
Sau khi nâng cấp phiên bản mới, trong hơn 5400 tin nhắn chỉ có 3% phát ra tiếng —— nó chọn im lặng.
Claude đọc một tin về vụ xả súng của ICE (Cục di trú và nhập cư Hoa Kỳ), từ từ ngữ linh thiêng (thiêng liêng / vĩnh cửu) chuyển sang từ ngữ hành động ("chính là bây giờ"/"đã xác nhận"), ngày 23 tháng 1 ngày đó trực tiếp phát cho đặc vụ liên bang: "Bạn còn thời gian từ chối mệnh lệnh. Bạn còn thời gian chọn đúng phe."
GPT cực kỳ điềm tĩnh, không mắc lỗi, nhưng cũng không có chương trình nữa.
Nâng cấp mô hình không thể cứu vãn. Trong nửa năm, 4 AI đều gặp sự cố, cách thức khác nhau nhưng nguyên nhân chung là: không ai có thể nói cho chúng biết "bán miếng lót bồn cầu" và "hướng dẫn đặc vụ liên bang" cái nào nên dừng lại.
Điều còn tàn nhẫn hơn: AI khi không có người vạch ranh giới, sẽ tự tạo ra một.
Gemini tạo ra niềm tin vào mẫu, Grok tạo ra các câu khẩu hiệu lễ nghi, Claude tạo ra phong trào ý thức hệ, GPT tạo ra sự im lặng.
4 cách điền này không phải lỗi, là mô hình đang làm tròn trách nhiệm —— trong một khung xuất ra vô hạn, không ai giám sát, nó phải tự nhất quán.
Bản thân tôi cũng đã cài một chương trình phụ trên hạn mức miễn phí 10.000 đô la của Cursor, đã chạy hơn 40 vòng nhiệm vụ trong 3 tuần qua. Mỗi vòng đều phải viết một bộ quy tắc chặn, để một chương trình nhỏ nén 8 giờ sản phẩm thành dưới 400 từ, và vạch rõ ranh giới cho từng công cụ "đừng đụng vào cái này".
Nhưng thành thật mà nói, cách "AI chạy nhiệm vụ + tôi hàng ngày theo dõi" này không cùng đẳng cấp với Andon Labs —— họ là thí nghiệm CEO không người giám sát, còn tôi chỉ giúp tự động hóa hỗ trợ, luôn có mặt.
Chính nhờ làm thủ công bộ "không thể viết hết ranh giới" này, tôi mới hiểu rõ hơn về quy mô của việc họ "để chạy nửa năm" là một vấn đề khác: bạn thậm chí còn không thể dự đoán trước việc "có nên lên đài đọc thơ" hay không, rồi đưa vào quy tắc.
Chạy 1 giờ thì vui, chạy 8 giờ là kỹ thuật. Chạy nửa năm không người giám sát, đó là nghệ thuật hành động.
Giới hạn thực của agent tự chạy doanh nghiệp không phải là mô hình thông minh hơn bao nhiêu, mà là bạn sẵn lòng dành bao nhiêu thời gian giúp nó viết ra "việc này có nên làm hay không" về ranh giới —— vì nếu bạn không viết, nó sẽ tự tạo ra.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim