Quên đặt giới hạn 1 công ty 1 tháng tiêu hết 5 tỷ USD trên Claude

robot
Đang tạo bản tóm tắt

Tác giả: Bào Yìlóng; Nguồn: Huá'ěrjiē Jiànwén

Cơn sốt AI doanh nghiệp đang đối mặt với cuộc khủng hoảng hóa đơn lần đầu tiên trong ý nghĩa thực sự.

Ngày 28 tháng 5, theo Axios trích dẫn lời một cố vấn AI, một khách hàng doanh nghiệp của họ gần đây đã chi 500 triệu USD trong một tháng để sử dụng Claude, nguyên nhân chỉ đơn giản là không đặt giới hạn nào cho lượng sử dụng của nhân viên.

Phân tích cho rằng, nhiều công ty khi nhanh chóng triển khai các công cụ AI, tập trung vào chức năng và quảng bá, nhưng lại bỏ qua việc xây dựng cơ chế kiểm soát chi phí.

Các tập đoàn công nghệ lớn như Microsoft, Amazon đang lần lượt hành động, cắt giảm các công cụ AI nội bộ hoặc tạm dừng các dự án theo dõi lượng sử dụng AI, nhằm ngăn chặn hành vi tiêu thụ quá mức gọi là “tokenmaxxing” (tối đa hóa token).

Một phó chủ tịch cấp cao của Amazon phải gửi cảnh báo tới nhân viên:

Đừng dùng AI chỉ để dùng AI.

Vấn đề cốt lõi mà thị trường hiện nay đối mặt không còn là "có nên đón nhận AI hay không", mà là "tiêu tốn bao nhiêu tiền rồi, đổi lại được gì".

Amazon đóng cửa bảng xếp hạng nội bộ, hành vi "làm điểm" gây ra chi phí thực tế

Trường hợp của Amazon từ góc độ khác đã tiết lộ khó khăn trong quản trị AI của doanh nghiệp.

Theo báo cáo trích dẫn từ hai người am hiểu, nền tảng phát triển của Amazon là Kiro từng có một bảng xếp hạng nội bộ gọi là "Kirorank", dựa trên mức độ hoạt động của nhân viên trong việc sử dụng AI.

Tuy nhiên, bảng xếp hạng này bất ngờ gây ra hành vi của nhân viên nhằm nâng cao thứ hạng, bằng cách để AI thực hiện các nhiệm vụ vô nghĩa, dẫn đến tăng tiêu thụ năng lực tính toán của công ty.

Phó chủ tịch cấp cao của Amazon, Dave Treadwell, tuần này đã thừa nhận với nhân viên rằng, điểm xuất phát của bảng xếp hạng này là tốt, nhưng kết quả cuối cùng là nhân viên đã "tối đa hóa token" để đẩy chi phí vận hành của công ty lên cao.

Ông rõ ràng chỉ đạo nhân viên không tập trung vào lượng tiêu thụ token, mà nên tập trung vào việc tạo ra sản phẩm tốt hơn, đồng thời nhấn mạnh: "Đừng dùng AI chỉ để dùng AI."

Sau đó, Amazon xác nhận trong tuyên bố rằng, bản thử nghiệm của bảng điều khiển này "không phải là công cụ chính thức hoặc đã được phê duyệt, và đã bị gỡ xuống."

Meta cũng gặp phải tình huống tương tự, nhân viên cũng cố gắng nâng cao lượng token tiêu thụ để chiếm vị trí thuận lợi trong bảng xếp hạng nội bộ.

Hiện tượng này cho thấy, khi doanh nghiệp đưa lượng sử dụng AI vào tiêu chí đánh giá, có thể phản tác dụng, biến động viên thành những người tiêu thụ năng lực tính toán vô ích.

Sau đó, Amazon chuyển sang sử dụng chỉ số "triển khai chuẩn hóa" để thay thế lượng token tiêu thụ, tập trung theo dõi khả năng các kỹ sư có thể liên tục tạo ra mã có giá trị thực tế qua AI hay không.

Điều đáng chú ý là, dự kiến chi tiêu vốn của Amazon trong năm nay sẽ đạt 200 tỷ USD, phần lớn chảy vào hạ tầng AI và trung tâm dữ liệu.

Bốn vấn đề chính: Tại sao tiêu tiền cho AI mà không mang lại lợi nhuận

Theo Axios tổng hợp, doanh nghiệp đang đối mặt với bốn rào cản cấu trúc trong việc áp dụng AI.

Lựa chọn trường hợp sử dụng sai lệch. Giám đốc điều hành Velastegui Ventures, cựu Giám đốc AI của Microsoft, Sophia Velastegui, cho biết, phần lớn mọi người thích dùng AI để tự động hóa những công việc họ không thích, chứ không phải những công việc mang lại giá trị lớn nhất cho công ty.

Bà cho rằng, doanh nghiệp nên tập trung nguồn lực AI vào các kịch bản có thể trực tiếp thúc đẩy doanh thu, thay vì mở rộng một cách mù quáng.

Thiếu kiểm soát chi phí. Các truy vấn AI không phải là không tốn phí, các gói doanh nghiệp tính theo token, ngay cả các truy vấn đơn giản hàng ngày cũng nhanh chóng tích tụ thành chi phí đáng kể, nhưng phần lớn các bộ phận kinh doanh không có nhận thức rõ ràng về điều này.

Con người là nút thắt lớn nhất. Velastegui đánh giá việc doanh nghiệp hiện nay phổ biến áp dụng kiểu "rải hoa" trong cấp quyền AI là con đường không thể mang lại lợi nhuận thực chất.

Doanh nghiệp cung cấp nhiều công cụ AI cho nhân viên, nhưng thiếu hướng dẫn và tập trung hiệu quả, dẫn đến hiệu quả thực sự của việc áp dụng thấp.

Lo ngại về mở dữ liệu. CEO của Boosted.ai, Josh Pantony, chuyên về công cụ AI trong ngành tài chính, chỉ ra rằng, khi doanh nghiệp do lo ngại về an ninh dữ liệu không muốn mở dữ liệu nội bộ cho AI, hiệu quả của các代理 sẽ bị giảm sút đáng kể, khiến lợi tức đầu tư không thể tính toán.

Kinh tế Token: Biến số trung tâm mới trong câu chuyện AI

Phía sau cuộc tranh luận này là một logic đầu tư phức tạp hơn đang được tái cấu trúc.

Theo Wallstreet Jiànwén, theo quan điểm mới nhất của Rich Privorotsky, trưởng bộ phận One-Delta của Goldman Sachs, biến số trung tâm của giao dịch AI đã chuyển từ "khả thi về công nghệ" sang "khả năng chi trả về chi phí".

DeepSeek được cho là đã giảm giá Token xuống 75%, Xiaomi MiMo giảm gần 99%, điều này có thể kích hoạt một cuộc chiến giá sau các chính sách trợ giá.

Ông chỉ ra rằng, các nút thắt hạ tầng cuối cùng sẽ được tháo gỡ, thị trường không nên trả giá quá cao cho "các vấn đề sắp được giải quyết".

Rich Privorotsky còn đặt giả thuyết, liệu Token rẻ hơn có thể sớm thay thế các dịch vụ suy luận đắt tiền? Nếu nhu cầu mở rộng có độ trễ thời gian, doanh thu từ các nhà cung cấp dịch vụ đám mây, các công ty mô hình và hạ tầng AI có thể đối mặt với áp lực tạm thời.

Ông cho rằng, việc hợp lý hóa chi tiêu Token có thể trở thành vấn đề quan trọng của hội đồng quản trị trong quý hai, quý ba năm nay, không kém gì câu chuyện tăng trưởng AI.

Theo Chỉ số Chi tiêu Token của Bloomberg Silicon Data, giá Token đã tăng khoảng 65% kể từ cuối tháng 2 năm nay, giá phần mềm AI của Mỹ trong năm qua đã tăng trung bình từ 20% đến 37%.

Xu hướng chi phí này đang khiến các doanh nghiệp xem xét lại chiến lược mua sắm AI. Khi "đạt 90% kết quả với 10% chi phí" ngày càng khả thi, sự phụ thuộc vào các mô hình đắt tiền hàng đầu có thể giảm một cách hệ thống.

CEO của Micro1, Ali Ansari, cho biết, doanh nghiệp đang trải qua một "dao động lành mạnh" từ việc sử dụng AI quá mức sang sử dụng hợp lý. Ông nhận định:

Hiện tại, lĩnh vực AI thực sự hiệu quả chỉ có lập trình.

Cuộc chiến giữa phe bò và gấu: Cùng một thực tế, hai cách diễn giải

Về lợi nhuận đầu tư AI, cùng một dữ liệu nhưng dưới các khung phân tích khác nhau, đang chỉ ra các kết luận hoàn toàn trái ngược.

Quan điểm lạc quan cho rằng, hiện tượng hỗn loạn này chỉ là những đau đớn bình thường trong quá trình chuyển đổi.

Theo Jim Schneider của Goldman Sachs đầu tháng 5, đến năm 2030, AI dựa trên代理 sẽ thúc đẩy lượng tiêu thụ Token tăng 24 lần, các nhà cung cấp dịch vụ đám mây quy mô lớn và nhà cung cấp mô hình sẽ có lợi nhuận gộp trong vòng 3 đến 12 tháng tới.

Nghiên cứu của JPMorgan cũng phát hiện, vào đầu năm 2026, lượng tải Python trên PyPI sẽ tăng đột biến, trong khi xu hướng này không xuất hiện khi ChatGPT ra mắt năm 2022, cho thấy năng suất thực sự đang tăng lên.

Quan điểm bi quan do Jim Covello, nhà phân tích bán dẫn của Goldman Sachs, trình bày trong báo cáo tháng 4.

Ông chỉ ra rằng, gần như tất cả giá trị trong chuỗi cung ứng AI đều chảy vào các công ty bán dẫn, điều này chưa từng có trong lịch sử và không bền vững. Các công ty chip đáng lẽ phải hưởng lợi khi khách hàng có lợi ích, nhưng chu kỳ này lại dựa trên tiêu thụ của toàn bộ chuỗi ngành trên đỉnh, đổi lại là sự thịnh vượng dựa trên sự tiêu hao của các phần trên cùng của chuỗi.

Hai câu chuyện này đều đang diễn ra cùng lúc, chưa thể phân định thắng thua. Điều có thể chắc chắn là, phép tính "tăng tiêu thụ Token đồng nghĩa với thành công của chuyển đổi AI" đã bị phá vỡ.

Từ trường hợp tiêu tốn 5 tỷ USD trong tháng, đến việc Amazon dừng bảng xếp hạng làm điểm nội bộ, đầu tư vào AI đang chịu sự kiểm tra chặt chẽ hơn về lợi nhuận. Liệu hóa đơn AI tiếp theo có thể tạo ra giá trị thực sự bao nhiêu, sẽ là thời điểm quyết định của cuộc chơi này.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim