Lấy danh nghĩa "an toàn" để giành quyền lực? Giải mã tâm lý mâu thuẫn của Anthropic: Chỉ khi chúng ta thống trị, thế giới mới an toàn

Theo bài báo chuyên sâu đăng trên tạp chí WIRED vào ngày 25 tháng 6 năm 2026, Anthropic – gã khổng lồ AI do các cựu nhân viên OpenAI thành lập – đang thể hiện một diện mạo doanh nghiệp vô cùng mâu thuẫn. Một mặt, họ lớn tiếng cảnh báo về nguy cơ hủy diệt quy mô lớn mà AI có thể gây ra; mặt khác, họ lại tích cực mở rộng vốn hóa thị trường lên gần 1 nghìn tỷ đô la Mỹ, thậm chí còn nhận hợp đồng quân sự từ Lầu Năm Góc. Trước những hoài nghi từ bên ngoài, nội bộ Anthropic kiên định với một triết lý cốt lõi: "Chỉ khi chúng ta đạt được thành công tuyệt đối, mới có thể đảm bảo an toàn cho AI." (Tóm tắt trước: Anthropic cáo buộc Alibaba tiến hành 'cuộc tấn công nhân bản lớn nhất lịch sử', tấn công Claude 28,8 triệu lần) (Bối cảnh bổ sung: Cựu nghiên cứu viên của Anthropic thành lập Mirendil, huy động được 200 triệu USD, tự xưng là 'AI có thể tự nâng cấp')

Mục lục bài viết

Toggle

  • Tự cho mình là 'người tốt', tin rằng độc quyền quyền lực là cái ác cần thiết
  • Hợp đồng quân sự gây tranh cãi, cơ chế bảo vệ ẩn bị chỉ trích
  • Điểm mù 'Chỉ có tôi mới giải quyết được': Nguy hiểm của sự thiếu đối trọng

Sự phát triển của trí tuệ nhân tạo là một cuộc chạy đua không thể tránh khỏi, nhưng trên con đường dẫn đến những điều chưa biết này, ai mới có tư cách cầm vô lăng? Một bài báo chuyên sâu mới nhất của WIRED đã phân tích sắc bén 'hội chứng cứu thế' và những mâu thuẫn doanh nghiệp đằng sau Anthropic – startup AI nổi tiếng.

Tự cho mình là 'người tốt', tin rằng độc quyền quyền lực là cái ác cần thiết

Anthropic được thành lập vào năm 2021 bởi một nhóm cựu nhân viên mất niềm tin vào CEO của OpenAI, Sam Altman, và tự xem mình là 'Công ty lợi ích công cộng (Public Benefit Corporation)'. Tuy nhiên, công ty không ngừng cảnh báo rằng AI có thể gây ra hỗn loạn xã hội thậm chí hủy diệt này, hiện đang tích cực theo đuổi mức định giá gần 1 nghìn tỷ đô la Mỹ và ráo riết tìm kiếm ảnh hưởng chính trị và quân sự.

Bài báo chỉ ra rằng hoạt động nội bộ của Anthropic dựa trên hai niềm tin cực kỳ tự tin: Thứ nhất, AI là công nghệ mang tính chuyển đổi nhất trong lịch sử loài người, sự xuất hiện của nó là không thể cản trở; thứ hai, nếu muốn thế giới trở nên tốt đẹp hơn, Anthropic phải giữ vị thế dẫn đầu tuyệt đối trong cuộc đua AI.

Cựu nhân viên tiết lộ, nội bộ công ty thường tự gọi mình là 'Người tốt (The good guys)', và coi OpenAI, Meta cùng xAI là những hình mẫu tiêu cực thiếu trách nhiệm. Trong các bài giảng nội bộ, CEO Dario Amodei liên tục nhấn mạnh rằng công ty phải tích lũy vốn, sức mạnh tính toán và nhân tài khổng lồ để tạo ra đủ 'lực hấp dẫn' định hướng toàn bộ ngành công nghiệp đi đến an toàn. Đối với họ, sự tập trung quyền lực cao độ là 'cái giá phải trả' để thực hiện sứ mệnh cứu thế.

Hợp đồng quân sự gây tranh cãi, cơ chế bảo vệ ẩn bị chỉ trích

Tuy nhiên, chiến lược 'không từ thủ đoạn mở rộng để đạt được mục tiêu an toàn' này đã nhiều lần chạm đến ranh giới đỏ đạo đức trong thực tế. Vào năm 2024, Anthropic hợp tác với gã khổng lồ dữ liệu lớn Palantir để cung cấp dịch vụ AI cho các cơ quan tình báo và quốc phòng Hoa Kỳ. Gần đây còn có tin Lầu Năm Góc đã sử dụng mô hình Claude để hỗ trợ xác định mục tiêu tấn công trong cuộc xung đột giữa Israel và Iran.

Trước những nghi vấn về việc có thể gây thương vong cho dân thường vô tội (ví dụ vụ tấn công trường tiểu học ở Iran khiến 120 người chết), Amodei chỉ bình thản trả lời 'không biết', và nhấn mạnh rằng chỉ cần 'quyết định cuối cùng do con người đưa ra', thì vẫn tuân thủ chính sách an toàn của công ty.

Ngoài ra, mô hình Claude Fable 5 vừa ra mắt trong tháng này cũng gây ra tranh cãi lớn. Mô hình này có tích hợp cơ chế bảo vệ ẩn: nếu phát hiện nhà nghiên cứu vi phạm điều khoản sử dụng nó cho phát triển AI tiên tiến (đặc biệt nhắm vào đối thủ nước ngoài), mô hình sẽ 'phá hoại bí mật' tiến độ công việc của họ. Hành động này đã gây ra sự phản đối mạnh mẽ từ giới công nghiệp về sự lạm quyền, cuối cùng buộc Anthropic phải rút lại cánh cửa bí mật này và thay đổi thành cơ chế bảo vệ công khai.

Điểm mù 'Chỉ có tôi mới giải quyết được': Nguy hiểm của sự thiếu đối trọng

Phân tích chiến lược của Anthropic, cựu giám đốc OpenAI, hiện là Giám đốc điều hành CSET thuộc Đại học Georgetown, Helen Toner, đã đưa ra một ví dụ sinh động: AI giống như một khu rừng đầy kho báu và quái vật, ai cũng muốn lao vào. Cách làm của Anthropic là 'tự mình đi sâu nhất', chiếm ưu thế trên bàn đàm phán, rồi sau đó cố gắng thuần hóa quái vật.

Nhưng các nhà phê bình cảnh báo, tư duy 'chỉ khi chúng ta kiểm soát mới an toàn' này có khiếm khuyết cấu trúc nghiêm trọng. Học giả Shazeda Ahmed từ Đại học California, Los Angeles (UCLA) chỉ ra rằng loại tổ chức này cực kỳ dễ rơi vào vòng lặp 'tự củng cố niềm tin', hoàn toàn bỏ qua điểm mù về sự tập trung quyền lực quá mức của chính mình.

Ngay cả khi CEO Amodei trong bài viết gần đây thừa nhận rủi ro về 'sự độc quyền quyền lực AI của một số ít phòng thí nghiệm', giải pháp ông đưa ra lại là 'giám sát cẩn thận' và 'cam kết công khai', thay vì phân tán quyền lực một cách thực chất. WIRED kết luận sắc bén ở cuối bài: Không ai thực sự biết AI sẽ thay đổi thế giới như thế nào, nhưng dưới lớp áo lý tưởng của Anthropic, những gì chúng ta thấy chỉ là một cỗ máy công nghệ khổng lồ tin rằng mình hiểu rõ nhất và cố gắng kiểm soát mọi quyền phát ngôn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận