Từ việc ép nhân viên dùng AI đến sợ đốt quá nhiều Token: Ngày càng nhiều doanh nghiệp thắt chặt hạn ngạch sử dụng AI nội bộ

Các doanh nghiệp tốn một năm ép nhân viên sử dụng AI, giờ lại phải ngăn họ dùng quá nhiều. Từ Accenture cấm nhân viên dùng AI để chuyển PDF, Uber đốt sạch ngân sách AI cả năm chỉ trong tháng 4, cho đến Amazon, Meta đồng loạt thắt chặt hạn mức, kỷ nguyên "tokenmaxxing" đã chết, liệu mô hình kinh doanh AI có thực sự xứng đáng với mức giá đó, ban lãnh đạo vẫn đang chờ câu trả lời.
(Tin trước: Ngày tận thế của Token đến: Làn sóng tăng giá token của GitHub Copilot gây phản ứng trái chiều, ngành AI chuyển hoàn toàn sang tính phí theo khối lượng)
(Bối cảnh bổ sung: GitHub Copilot thay đổi cách tính phí, hé lộ "lời nói dối lớn nhất" của ngành AI)

Mục lục bài viết

Toggle

  • Từ bảng xếp hạng đến lệnh cấm
  • Tại sao hóa đơn tăng vọt?
  • Mô hình kinh doanh AI bị đặt dấu hỏi

Cách đây một năm, doanh nghiệp nói với nhân viên: Không dùng AI có thể mất cơ hội thăng tiến. Kết quả là giờ đây chính các doanh nghiệp đó lại đang họp bàn cách ngăn nhân viên dùng AI để làm PowerPoint. Accenture, Uber, Amazon, Meta, Walmart, Cisco, những doanh nghiệp này trong nửa đầu năm 2026 gần như đồng loạt tuyên bố thắt chặt hạn mức sử dụng AI nội bộ. Điểm chung của họ chỉ có một: Đã đổ rất nhiều tiền vào AI, nhưng không thể nói rõ đã đổi lại được gì?

Từ bảng xếp hạng đến lệnh cấm

Sự phi lý của vấn đề nằm ở chỗ, nhiều doanh nghiệp tự đẩy nhân viên vào cái hố này.

Cách đây không lâu, một số doanh nghiệp còn thiết lập bảng xếp hạng sử dụng AI cho nhân viên, khuyến khích sử dụng nhiều. Accenture thậm chí còn ám chỉ với nhân viên rằng không dùng AI "có thể mất cơ hội thăng tiến". Đây là một logic quản lý hợp lý, nếu bạn muốn thúc đẩy chuyển đổi số, bạn phải tạo thói quen sử dụng trong tổ chức.

Kết quả là thói quen được hình thành, nhưng mục đích sử dụng lại lệch hướng. Theo đoạn ghi âm cuộc họp nội bộ của Accenture mà 404 Media có được, nhân viên bắt đầu dùng kho dự trữ token của công ty cho các việc vặt cơ bản, chẳng hạn như chuyển đổi PDF thành slide thuyết trình. Những tác vụ này không tạo ra bất kỳ giá trị kinh doanh nào, nhưng mỗi lần thao tác đều đốt tiền.

Justice Kwak, Giám đốc chiến lược AI tác nhân của Accenture, đã chỉ ra trực tiếp cốt lõi của vấn đề:

"Chúng ta đang đến một bước ngoặt, nơi AI bắt đầu trở thành một phần quan trọng trong cơ cấu chi phí; chi tiêu trở nên rất khó dự đoán, và ban lãnh đạo, đặc biệt là cấp CFO, COO, CIO, vẫn đang hỏi, số tiền chúng ta chi cho AI này, rốt cuộc có đổi lại được giá trị hay không."

Tình hình của Uber còn cực đoan hơn. Công ty này đã đốt sạch toàn bộ ngân sách AI của cả năm vào tháng 4 năm 2026, buộc phải khẩn cấp đặt giới hạn: Mỗi nhân viên có hạn mức token hàng tháng cho các công cụ coding tác nhân (như Claude Code, Cursor) là 1.500 USD. Trước khi đặt giới hạn, hóa đơn hàng tháng của từng kỹ sư phần mềm dao động từ 500 đến 2.000 USD. Đánh giá của Andrew Macdonald, Chủ tịch kiêm Giám đốc điều hành Uber, thẳng thắn đến mức khó chịu: "Để kết nối việc công ty sử dụng rộng rãi Claude Code với sự đổi mới phục vụ người tiêu dùng, mối liên kết đó vẫn chưa tồn tại."

Tại sao hóa đơn tăng vọt?

Năm 2025, mô hình kinh doanh chính của Anthropic và OpenAI là đăng ký hàng tháng với phí cố định. Nói đơn giản là, doanh nghiệp trả một khoản phí cố định, nhân viên có thể sử dụng công cụ AI, giống như đăng ký Office 365, dùng quá cũng không bị tính thêm tiền. Mô hình này khuyến khích sử dụng nhiều.

Tuy nhiên, đến năm 2026, cả hai công ty đều chuyển hầu hết các gói dịch vụ doanh nghiệp sang tính phí dựa trên mức sử dụng token. "Token" là đơn vị cơ bản để mô hình AI xử lý văn bản, nói một cách dễ hiểu, mỗi khi mô hình đọc một chữ, viết một chữ, đều phải tính phí. Giao diện chat thông thường có lượng sử dụng hạn chế, hóa đơn có thể kiểm soát. Nhưng AI tác nhân, tức là các tác nhân AI có thể tự động thực hiện các tác vụ đa bước, chẳng hạn như tự động viết mã, tìm kiếm dữ liệu, gửi yêu cầu, mỗi lần hoàn thành một tác vụ có thể tiêu tốn hàng chục nghìn token, cấu trúc hóa đơn hoàn toàn khác.

Đây chính là nguyên nhân sâu xa khiến hóa đơn doanh nghiệp tăng vọt: Trước đây, các công cụ trả phí hàng tháng, giờ đây tính phí cho từng lần tính toán, và lượng sử dụng của các tác nhân tự động hầu như không bị kiềm chế tự nhiên bởi bất kỳ hành vi nào của con người.

"Token rationing" – phân phối token – đang lan truyền trong nội bộ các doanh nghiệp. Nói đơn giản, hạn mức sử dụng AI bắt đầu bị quản lý, giống như doanh nghiệp quản lý chi phí đi lại hoặc giấy phép phần mềm.

Mô hình kinh doanh AI bị đặt dấu hỏi

Đây không chỉ là quyết định tiết kiệm của vài doanh nghiệp, mà là bài kiểm tra áp lực thực tế đầu tiên mà toàn bộ mô hình kinh doanh của ngành AI phải đối mặt.

Tờ New York Times đặt tên cho xu hướng này là "token-minimizing", và chỉ ra rằng các doanh nghiệp đang xem xét lại một cách có hệ thống tỷ suất hoàn vốn (ROI) của chi tiêu AI. Tạp chí Fortune đặt vấn đề trực tiếp hơn: tokenmaxxing đã chết, các doanh nghiệp không đạt được lợi tức như kỳ vọng ban đầu.

Từ góc độ kỹ thuật, khả năng của các mô hình AI thực sự đang không ngừng tiến bộ. Nhưng giữa "sự tiến bộ về khả năng của mô hình" và "lợi ích thực tế của doanh nghiệp" tồn tại một khoảng cách chưa được lấp đầy. Macdonald của Uber đã nói ra tiếng lòng của nhiều CXO: Nhân viên dùng Claude Code tạo ra lượng lớn mã nguồn, nhưng số mã nguồn đó có thực sự cải thiện trải nghiệm người dùng cuối hay không, không ai có thể đưa ra mối liên kết rõ ràng.

Ngành AI đã vượt qua giai đoạn "mới lạ thú vị" có thể che đậy mọi thứ. Giờ đây, nó phải đối mặt với một vấn đề rất nhàm chán nhưng quan trọng: tỷ suất hoàn vốn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim