Báo cáo chuyên sâu của Goldman Sachs: Điểm chuyển biến sắp tới Giải mã nền kinh tế trí tuệ nhân tạo AI

robot
Đang tạo bản tóm tắt

Trí tuệ nhân tạo đại lý (Agentic AI) đang chuyển ngành công nghiệp trí tuệ nhân tạo từ câu chuyện về chi phí sang câu chuyện về lợi nhuận. Goldman Sachs cho rằng, khi lượng token tiêu thụ sắp có sự tăng vọt, trong khi tốc độ giảm chi phí tính toán nền tảng đã vượt qua mức giảm giá token, điểm biến đổi lợi nhuận của các nhà cung cấp đám mây quy mô lớn và nhà cung cấp mô hình lớn có thể sẽ xuất hiện trong vòng 3 đến 12 tháng tới.

Theo đài truyền thông Chasing Wind, ngày 5 tháng 5, Goldman Sachs đã phát hành báo cáo cho biết, ngân hàng dự đoán đến năm 2030, tổng lượng token tiêu thụ toàn cầu do AI tiêu dùng và doanh nghiệp thúc đẩy sẽ tăng gấp 24 lần so với mức của năm 2026, đạt khoảng 120 nghìn tỷ token mỗi tháng; nếu tính theo tỷ lệ đạt đỉnh của các đại lý doanh nghiệp vào năm 2040, con số này sẽ mở rộng thêm 55 lần.

Trong khi đó, các suy luận của Goldman Sachs về đường cong giá cả và chi phí cho thấy, giá token của các mô hình lớn phổ biến đã từ mức giảm khoảng 40% mỗi năm trước đây trở nên ổn định thậm chí có xu hướng tăng nhẹ, trong khi chi phí tính toán cho mỗi token do các chip như Nvidia, AMD, TPU của Google và Trainium dẫn đầu vẫn tiếp tục giảm với tốc độ 60% đến 70% mỗi năm, hai đường cong này đang tạo ra sự chênh lệch giúp mở ra không gian lợi nhuận cho ngành. Chi tiêu vốn quy mô lớn cho hạ tầng AI có thể sẽ nhận được sự hỗ trợ kinh tế bền vững hơn nhờ cải thiện tỷ suất lợi nhuận.

Điểm biến đổi kinh tế Token: Chi phí giảm nhanh hơn giá, không gian lợi nhuận đang mở ra

Luận điểm cốt lõi trong báo cáo của Goldman Sachs là, ngành AI đang chuyển từ giai đoạn "kinh tế suy đoán, có thể làm loãng lợi nhuận" sang giai đoạn mới "tăng thêm token với lợi nhuận biên hấp dẫn và thu về lợi ích."

Trong giai đoạn đầu của chu kỳ AI, các nhà đầu tư thường xem trọng khả năng tính toán và token như các yếu tố thúc đẩy chi phí — sử dụng nhiều hơn đồng nghĩa với tải trọng suy luận lớn hơn, nhiều bộ tăng tốc, nhiều điện năng và chi tiêu vốn cao hơn. Nhưng các suy luận về đường cong giá cả và chi phí của Goldman Sachs cho thấy, logic này đang thay đổi.

Mặc dù giá token của các mô hình lớn phổ biến đã giảm mạnh, nhưng hiện đã ổn định hoặc thậm chí có xu hướng tăng trở lại trong một số trường hợp; đồng thời, chi phí toàn bộ cho mỗi token do Nvidia, Google TPU (Broadcom), AMD và Trainium (Marvell) vẫn đang giảm nhanh và liên tục. Nếu giá token duy trì ở mức cao hơn chi phí token, thì việc tăng tỷ lệ sử dụng AI đại lý sẽ mang lại mở rộng lợi nhuận tích cực, chứ không chỉ đơn thuần là tăng doanh thu.

Goldman Sachs còn nhấn mạnh, AI đại lý có thể tạo ra một vòng đua kinh tế tự củng cố: chi phí tính toán cho mỗi token thấp hơn thúc đẩy các đại lý phong phú và phức tạp hơn; các đại lý phong phú này qua việc sử dụng dài hơn, vòng lặp nhiều hơn, xác thực nhiều hơn và giám sát liên tục sẽ tiêu thụ nhiều token hơn; tỷ lệ sử dụng cao hơn sẽ cải thiện tính kinh tế của hạ tầng AI, từ đó hỗ trợ các nhà cung cấp liên tục đầu tư vào chất lượng mô hình và khả năng phân phối. Goldman Sachs cho rằng, vòng đua này khác hoàn toàn với câu chuyện phổ biến "AI sẽ mang lại gánh nặng chi phí không bền vững" trên thị trường.

Tuy nhiên, Goldman Sachs cũng cảnh báo rủi ro: không phải tất cả các tải công việc AI đều có thể đảm bảo đạt điểm lợi nhuận tích cực. Đối với các chatbot thuần túy có mức độ thương mại hóa cao, cạnh tranh vẫn có thể khiến tốc độ giảm giá token nhanh hơn tốc độ giảm chi phí tính toán.

Tiêu dùng đại lý: Từ đối thoại phân mảnh đến trợ lý "thường trực", tiêu thụ token sẽ tăng 12 lần

Goldman Sachs ước tính, đến năm 2030, các đại lý AI tiêu dùng có thể nâng tổng lượng token tiêu thụ toàn cầu lên gấp 12 lần, mỗi tháng thêm khoảng 60 nghìn tỷ token.

Báo cáo phân loại các đại lý tiêu dùng thành hai loại: Một là "theo nhu cầu" như OpenAI Operator, Claude Code, các đại lý trình duyệt, do người dùng khởi xướng nhiệm vụ rồi tự lập kế hoạch, thực thi và trả kết quả; hai là "thường trực" như các đại lý chạy liên tục trong nền như giám sát email, quản lý lịch trình hoặc trợ lý cuộc sống số. Goldman Sachs cho rằng, sự tăng vọt lớn nhất về tiêu thụ token sẽ xảy ra khi các đại lý chuyển từ việc người dùng khởi xướng nhiệm vụ sang trạng thái chạy liên tục nền — các đại lý liên tục theo dõi ngữ cảnh và chủ động hành động khi cần thiết.

Dữ liệu mô phỏng cho thấy, chatbot LLM thông thường tiêu thụ khoảng 1.000 token mỗi lần hội thoại, Copilot tích hợp tiêu thụ hơn 5.000 token mỗi ngày, còn các đại lý thường trực có thể tiêu thụ hơn 100.000 token mỗi ngày.

Goldman Sachs dự đoán, đến năm 2030, lượng truy vấn AI hàng ngày sẽ tăng từ khoảng 5 tỷ lần vào năm 2025 lên khoảng 23 tỷ lần, trong đó tối đa 30% sẽ tập trung vào các đại lý trong lĩnh vực tìm kiếm, mua sắm, du lịch, email và năng suất cá nhân. Trong khi đó, thị phần của các công cụ tìm kiếm truyền thống dự kiến sẽ giảm từ 68% vào năm 2025 xuống còn 36% vào năm 2030, còn các ứng dụng gốc LLM sẽ tăng từ 12% lên 31%.

Doanh nghiệp: Độ phức tạp của quy trình làm việc thúc đẩy cường độ token, tiêu thụ vào năm 2040 có thể đạt 55 lần

Goldman Sachs dự đoán, các đại lý AI doanh nghiệp sẽ trở thành nhân tố nhân lên lượng token lớn nhất, đến năm 2030 thúc đẩy tăng gấp 24 lần lượng tiêu thụ token toàn cầu, và đến đỉnh điểm vào năm 2040, con số này sẽ tăng thêm 55 lần, khi đó khối lượng công việc của doanh nghiệp sẽ chiếm hơn 70% tổng lượng sử dụng token toàn cầu.

Lý do các đại lý doanh nghiệp có cường độ token cao hơn so với đại lý tiêu dùng là vì các quy trình làm việc của chúng yêu cầu thực hiện các thao tác phức tạp và chính xác hơn — giám sát nhiệm vụ, truy xuất ngữ cảnh, suy luận bất thường, xác thực đầu ra, cập nhật hệ thống và liên tục báo cáo vấn đề trong suốt ngày làm việc. Ngoài ra, các đại lý doanh nghiệp thường liên quan đến đầu vào đa phương thức nặng hơn (giọng nói, hình ảnh, tài liệu, hoạt động màn hình, dữ liệu ứng dụng, nhật ký và ghi chép hệ thống có cấu trúc), điều này sẽ làm tăng đáng kể cường độ token.

Goldman Sachs đã xây dựng các mô phỏng đại lý để đo lường lượng token tiêu thụ của các nghề nghiệp khác nhau.

Kết quả cho thấy, đại lý lập trình tiêu thụ khoảng 7 triệu token mỗi ngày, chi phí API khoảng 13 USD/ngày, thấp hơn nhiều so với chi phí nhân công, giải thích tại sao tốc độ áp dụng đại lý trong lĩnh vực phát triển phần mềm nhanh nhất; đại lý tổng đài tiêu thụ khoảng 2 triệu token mỗi ngày, nhưng nếu dựa vào xử lý giọng nói thời gian thực, chi phí có thể lên tới 92 USD/ngày, khiến tự động hóa hoàn toàn bằng giọng nói vẫn chưa khả thi về mặt kinh tế; đại lý nhập dữ liệu tiêu thụ khoảng 25 triệu token mỗi ngày, chi phí khoảng 60 USD/ngày, vẫn thấp hơn chi phí nhân công.

Goldman Sachs nhấn mạnh, tốc độ áp dụng đại lý doanh nghiệp sẽ phụ thuộc vào bốn biến số: lượng token, chi phí API, tổ hợp chế độ và độ phức tạp của triển khai. Các quy trình dựa chủ yếu vào văn bản và hệ sinh thái công cụ đã trưởng thành sẽ sớm quy mô hóa; các quy trình dựa vào giọng nói hoặc tích hợp sâu vào hệ thống nền tảng có thể tiến triển chậm hơn.

Xét theo đường cong áp dụng, Goldman Sachs cho rằng, AI đại lý doanh nghiệp có khả năng theo đuổi mô hình hình chữ S, dự kiến tỷ lệ đạt đỉnh khoảng 35% đến 40% các nhân viên trí thức, thời điểm đạt đỉnh khoảng 15 năm, nhanh hơn trung bình của các công nghệ trước đó (29 năm).

Tính bền vững của chi tiêu vốn: Cải thiện lợi nhuận mang lại không gian lớn hơn cho các nhà đám mây quy mô lớn

Một kết luận đầu tư quan trọng trong báo cáo của Goldman Sachs là, việc cải thiện tỷ suất lợi nhuận của các nhà đám mây quy mô lớn sẽ làm cho các khoản đầu tư hạ tầng hiện tại có khả năng duy trì tốt hơn, từ đó giải quyết các lo ngại chính về tỷ lệ hoàn vốn của vốn đầu tư AI trên thị trường.

Báo cáo chỉ ra rằng, hiện các nhà vận hành vẫn còn bị hạn chế về nguồn cung trong việc đáp ứng nhu cầu tính toán hiện tại và tương lai, Google và Meta đều đã nâng dự báo chi tiêu vốn cho năm tài chính 2026, còn ban quản lý Amazon sau báo cáo tài chính quý I cũng đã nhắc lại chiến lược duy trì chi tiêu cao. Goldman Sachs dự đoán, khi điểm biến đổi lợi nhuận đến gần, các nhà đầu tư sẽ ngày càng tìm kiếm bằng chứng về khả năng sinh lời rõ ràng.

Trong các mục tiêu cụ thể, Goldman Sachs cho rằng, sự tăng trưởng doanh thu của Amazon từ việc tăng tốc độ tăng trưởng của AWS (tăng 28% so với cùng kỳ quý I) và tồn kho đơn hàng trị giá 364 tỷ USD; quan điểm về Google dựa trên tăng trưởng 63% doanh thu đám mây trong quý I và đơn hàng tồn kho gần như gấp đôi so với quý trước, đạt khoảng 460 tỷ USD; còn nhận định về Meta dựa trên tốc độ tăng trưởng quảng cáo vượt xa toàn ngành quảng cáo kỹ thuật số, cùng với đóng góp liên tục của AI vào tăng cường sự tham gia của người dùng và khả năng kiếm tiền từ quảng cáo.

Trong lĩnh vực phần mềm, Goldman Sachs cho rằng, chi phí token thấp hơn giúp các nhà cung cấp phần mềm dễ dàng tích hợp đại lý vào các sản phẩm hiện có mà không ảnh hưởng đáng kể đến tỷ suất lợi nhuận gộp, đồng thời hỗ trợ định giá dựa trên kết quả, năng suất hoặc đơn vị công việc thay vì dựa vào số lượng chỗ ngồi, từ đó mở rộng thị trường phần mềm có thể tiếp cận. Đối với các công ty dịch vụ CNTT, khi các đại lý chuyển đổi tiêu thụ AI từ công cụ độc lập sang quy trình làm việc doanh nghiệp tích hợp cao, nhu cầu về tích hợp, quản trị và điều phối dịch vụ sẽ tăng mạnh, trong đó Accenture được xem là một trong những đơn vị hưởng lợi chính của xu hướng này.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim