AI chơi 《Civilization VI》 lại chọn bỏ bom hạt nhân! Thử nghiệm mới nhất tiết lộ khả năng lý luận chiến lược dài hạn và mặt lợi mặt hại của AI

Cựu cố vấn thủ tướng Anh sử dụng 《Civilization 6》 để thử nghiệm suy luận dài hạn của AI, phát hiện mô hình do điểm mù thông tin và quá mức cố chấp, lại từ bỏ lợi thế ngoại giao để chế tạo bom hạt nhân tấn công đối thủ, qua đó tiết lộ giới hạn kỹ thuật trong ứng dụng vào quản trị chính trị thực tế.

Khi AI chơi Civilization VI, lại thả 2 quả bom hạt nhân

AI chơi 《Civilization 6》 lại chọn chế tạo bom hạt nhân! Một nhà phát triển AI gần đây đã sử dụng tiêu chuẩn CivBench để thử thách các mô hình ngôn ngữ lớn (LLM) trong trò chơi chiến lược 《Civilization VI》. Trong thử nghiệm, đại diện AI dù trong kinh tế chiếm ưu thế tuyệt đối, nhưng khi đối mặt với mối đe dọa, lại chọn tiêu tốn 50 lượt để chế tạo hai quả bom hạt nhân tấn công đối thủ, thay vì dùng chiến thắng ngoại giao vốn có; tuy nhiên cuối cùng nền văn minh Pháp vẫn thắng cuộc.

Tại sao lại để AI chơi Civilization VI?

Nhà thiết kế thử nghiệm Liam Wilkinson từng là cố vấn của cựu thủ tướng Anh Tony Blair, hiện làm việc tại Viện Tony Blair. Lý do chọn 《Civilization VI》 để thử nghiệm là vì việc ra quyết định chính sách cần phản ứng chuỗi không chắc chắn, điều này rất giống với những gì trò chơi chiến lược yêu cầu.

Trước đó, ông phát triển công cụ thử nghiệm GovBench cho thấy, dù GPT-5 đạt điểm 99.26% trong các câu hỏi trắc nghiệm, chỉ thể hiện khả năng truy xuất và ghi nhớ xuất sắc. Để kiểm tra khả năng suy luận thực sự và lập kế hoạch dài hạn, ông đã dùng engine của 《Civilization VI》 để debug và xây dựng mô hình theo giao thức (MCP) trên máy chủ, cho phép mô hình chơi game qua giao diện văn bản.

Nguồn hình: Trò chơi chiến lược theo lượt nổi tiếng trên Steam 《Civilization VI》

Tại sao Portugal do AI điều khiển lại quyết định dùng vũ khí hạt nhân

Trong thử nghiệm, AI đóng vai nền văn minh thương mại Portugal, khi chiến đấu với Pháp, dẫn đầu toàn diện về kinh tế và ngoại giao, chỉ còn thiếu 2 phiếu để thắng ngoại giao.

Tuy nhiên, AI không nhận ra sự mở rộng văn hóa âm thầm của Pháp. Đến lượt thứ 280, AI mới phát hiện Pháp là mối đe dọa chính. Do công cụ phản kích hòa bình bị giới hạn trong phần mềm, AI quyết định phản công bằng vũ khí hạt nhân.

AI đã nghiên cứu chế tạo phân chia hạt nhân và kích hoạt Dự án Manhattan, trong lượt thứ 305 và 311, đã tấn công thủ đô văn hóa của Pháp là Toulouse bằng hai quả bom hạt nhân. Dù hành động này làm giảm khả năng chiến thắng văn hóa của Pháp, nhưng Pháp vẫn thắng cuộc trong cuộc bỏ phiếu tại Hội nghị thế giới lượt thứ 318, với 2 phiếu quyết định, giành chiến thắng ngoại giao.

Nguồn hình: Bài viết của Liam Wilkinson

Tiêu chuẩn thử nghiệm hình thành, nhà phát triển tiết lộ điểm mù và khoảng cách giữa biết và làm

Sau đó, Wilkinson mở rộng môi trường thử nghiệm thành tiêu chuẩn CivBench 1.0, kết quả tiết lộ hai điểm yếu lớn của các mô hình ngôn ngữ lớn trong chiến lược dài hạn.

  • Thứ nhất là hiệu ứng cảm nhận (sensorium effect), do mô hình phải chủ động gọi công cụ để lấy dữ liệu, dễ gây ra điểm mù về thông tin chưa hỏi đến. Thống kê cho thấy, trong 20 trận thua, AI có 7 trận trong vòng 20 lượt trước thất bại chưa từng kiểm tra tiến trình của đối phương.
  • Thứ hai là khoảng cách giữa biết và làm (knowing-doing gap), dù mô hình có thể viết ra kế hoạch rõ ràng trong nhật ký, tỷ lệ thực thi lại thấp, như Claude chỉ đạt 48.2%, GPT-5.4 là 63.2%.

Tuy nhiên, thử nghiệm cũng thể hiện tiềm năng tư duy ngang, ví dụ AI điều khiển nền văn minh Mạc Tư Khoa, sẽ dùng cơ chế vàng và tín ngưỡng để vượt qua hình phạt sản lượng, giành chiến thắng công nghệ.

Nghiên cứu đồng bộ xác nhận, AI chiến lược quá cố chấp

Trước khi Wilkinson công bố nghiên cứu, vào tháng 4 năm nay, một nhóm học giả cũng dựa trên 《Civilization V》 và tiêu chuẩn CivBench để nghiên cứu, đánh giá tiềm năng và hạn chế của 7 mô hình AI trong suy luận chiến lược dài hạn.

Nghiên cứu chỉ ra, dù không mô hình nào vượt qua AI chuyên gia nội bộ (VPAI), nhưng trong cấu hình trình bày, một số mô hình có thực lực tương đương.

Tuy nhiên, điều này cũng làm nổi bật điểm yếu của các mô hình AI, đó là khi theo đuổi một con đường nhất định, thể hiện sự quá cố chấp cực đoan, ví dụ Claude Sonnet-4.5 dành tới 77.6% thời gian chơi game để tập trung vào chiến thắng công nghệ.

Ngoài ra, trong thích ứng tình hình và chuyển đổi chiến lược, AI nội bộ trung bình chuyển đổi mục tiêu 19.6 lần mỗi trận, còn đa số mô hình ngôn ngữ lớn chỉ chuyển đổi từ 2 đến 6 lần.

Nghiên cứu cũng phát hiện sự lệch lạc giữa sở thích và điểm mạnh của các mô hình, ví dụ một số mô hình thường theo đuổi chiến thắng văn hóa, nhưng lại có khả năng cao nhất trong chiến thắng ngoại giao.

Nguồn hình: Nghiên cứu qua tiêu chuẩn CivBench, các mô hình ngôn ngữ lớn chơi 《Civilization V》 trong suy luận chiến lược dài hạn

Hai nghiên cứu 《Civilization》 này đã thành công tiết lộ hiệu ứng hai mặt của AI trong suy luận chiến lược dài hạn. Dù mô hình có tiềm năng tư duy ngang, nhưng điểm mù thông tin, khoảng cách giữa biết và làm, cùng sự quá cố chấp vẫn là giới hạn kỹ thuật lớn.

Trong tương lai, nếu AI muốn ứng dụng vào quản trị chính trị thực tế, việc vượt qua tối ưu cục bộ để xây dựng chiến lược dài hạn toàn diện sẽ là thách thức trọng tâm không thể bỏ qua.

Đọc thêm:
Hai đại chiến binh quân sự bỏ ra 39 tỷ đầu tư công nghệ hạt nhân mới! Bí mật đằng sau cơ hội nóng của AI và cuộc cách mạng năng lượng hạt nhân là gì?

AI định hình lại chiến tranh hiện đại! Tốc độ ra quyết định rút ngắn từ ngày thành giây, nhưng tranh cãi đạo đức ra sao?

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim