Khủng hoảng chi phí của AI: Kinh tế hạ tầng sẽ định hình lại giai đoạn tiếp theo của thị trường như thế nào

Nguồn: International Business Times UK

Tác giả gốc: Anastasia Matveeva |

Biên tập: Gonka.ai

AI đang mở rộng với tốc độ đáng kinh ngạc, nhưng nền kinh tế cơ bản của nó còn yếu hơn nhiều so với vẻ bề ngoài. Khi ba ông lớn đám mây kiểm soát hai phần ba sức mạnh tính toán toàn cầu, chi phí huấn luyện tiến tới 1 tỷ USD, và hóa đơn suy luận khiến các công ty khởi nghiệp bất ngờ — thì giá trị thực của cuộc đua vũ khí tính toán này đang âm thầm định hình lại phân phối giá trị trong toàn ngành AI.

Bài viết này không bàn về ai sẽ xây dựng được mô hình tiên tiến nhất. Nó đặt ra một câu hỏi mang tính nền tảng hơn: Mô hình kinh tế hạ tầng AI hiện tại, sau khi mở rộng quy mô, có thực sự bền vững không? Và những thay đổi trong cơ chế phân phối sức mạnh tính toán sẽ định hình lại thị trường như thế nào?

  1. Chi phí trí tuệ phía sau màn hình

Huấn luyện một mô hình lớn tiên tiến thường tiêu tốn hàng chục triệu đến hàng trăm triệu USD. Anthropic từng công bố rằng chi phí huấn luyện Claude 3.5 Sonnet là “hàng chục triệu USD”, trong khi CEO Dario Amodei dự đoán chi phí cho thế hệ mô hình tiếp theo có thể gần 1 tỷ USD. Theo các báo cáo ngành, chi phí huấn luyện GPT-4 có thể đã vượt quá 100 triệu USD.

Tuy nhiên, chi phí huấn luyện chỉ là phần nổi của tảng băng chìm. Thực chất gây áp lực liên tục về mặt cấu trúc là chi phí suy luận — tức là phí phát sinh mỗi lần mô hình được gọi. Theo giá API công khai của OpenAI, phí suy luận tính theo triệu token. Đối với các ứng dụng có tần suất sử dụng cao, điều này có nghĩa là ngay cả trước khi mở rộng quy mô, chi phí suy luận hàng ngày đã có thể lên tới hàng nghìn USD.

AI thường được mô tả như một phần mềm. Nhưng bản chất kinh tế của nó ngày càng giống một hạ tầng vốn đòi hỏi đầu tư lớn — vừa có chi phí ban đầu cao, vừa có chi phí vận hành liên tục.

Cơ cấu kinh tế này đang âm thầm thay đổi cục diện cạnh tranh trong ngành AI. Những ai có khả năng chi trả cho sức mạnh tính toán là các ông lớn đã xây dựng hạ tầng quy mô lớn; còn các startup cố gắng tồn tại trong khe hở thì đang bị hóa đơn suy luận từng chút một “ăn mòn”.

  1. Tăng cường vốn và tập trung thị trường

Theo phân tích thị trường đám mây của Holori năm 2026, AWS chiếm khoảng 33% thị trường đám mây toàn cầu, Microsoft Azure khoảng 22%, Google Cloud khoảng 11%. Ba ông lớn này kiểm soát khoảng hai phần ba hạ tầng đám mây toàn cầu, trong khi phần lớn các tải trọng AI đều chạy trên hạ tầng của họ.

Ý nghĩa thực tế của sự tập trung này là: Khi API của OpenAI gặp sự cố, hàng nghìn sản phẩm cùng bị ảnh hưởng; khi một nhà cung cấp dịch vụ đám mây chính gặp lỗi, dịch vụ xuyên ngành, xuyên khu vực cũng bị gián đoạn.

Sự tập trung này không hề thu hẹp lại, mà còn tiếp tục mở rộng. Ví dụ, Nvidia đã đạt doanh thu trung bình hàng năm trên 80 tỷ USD từ mảng trung tâm dữ liệu, cho thấy nhu cầu GPU hiệu năng cao vẫn rất lớn.

Điều đáng chú ý hơn là một bất cân xứng cấu trúc tiềm ẩn. Theo hồ sơ SEC và các báo cáo thị trường, các phòng thí nghiệm hàng đầu như OpenAI, Anthropic ký các thỏa thuận “đổi cổ phần lấy sức mạnh tính toán” trị giá hàng tỷ USD, với giá gần như tối thiểu 1,30–1,90 USD mỗi giờ để khóa GPU. Trong khi đó, các công ty nhỏ hơn không có quan hệ hợp tác chiến lược với Nvidia, Microsoft, Amazon buộc phải mua GPU với giá bán lẻ hơn 14 USD mỗi giờ — cao gấp 600 lần.

Khoảng cách về giá này chính là kết quả của các khoản đầu tư chiến lược trị giá 400 tỷ USD của Nvidia vào các phòng thí nghiệm hàng đầu gần đây. Quyền tiếp cận hạ tầng AI ngày càng bị quyết định bởi các thỏa thuận mua sắm vốn đòi hỏi vốn lớn, chứ không còn dựa vào cạnh tranh thị trường mở.

Trong giai đoạn sớm, sự tập trung này có thể trông “hiệu quả”. Nhưng sau khi mở rộng quy mô, nó mang lại rủi ro về giá cả, tắc nghẽn cung ứng và phụ thuộc hạ tầng — ba yếu tố dễ tổn thương cộng hưởng.

  1. Chiều năng lượng bị bỏ quên

Một khía cạnh thường bị bỏ qua trong chi phí hạ tầng AI là năng lượng.

Theo dữ liệu của Cơ quan Năng lượng Quốc tế (IEA), các trung tâm dữ liệu hiện chiếm khoảng 1–1,5% tiêu thụ điện toàn cầu, và nhu cầu tăng do AI dự kiến sẽ đẩy tỷ lệ này lên đáng kể trong vài năm tới.

Điều này có nghĩa là, kinh tế sức mạnh tính toán không chỉ là vấn đề tài chính, mà còn là thách thức về hạ tầng và năng lượng. Khi khối lượng công việc AI tiếp tục mở rộng, ý nghĩa địa chính trị của nguồn cung điện sẽ ngày càng rõ nét — quốc gia nào cung cấp sức mạnh tính toán ổn định nhất với chi phí năng lượng thấp nhất sẽ có lợi thế chiến lược trong cuộc đua AI.

Khi Jensen Huang công bố tại GTC26 rằng Nvidia đã đạt dự báo đơn hàng trị giá hơn 1 nghìn tỷ USD, ông không chỉ nói về thành công thương mại của công ty, mà còn mô tả quá trình chuyển đổi quy mô lớn của toàn bộ nền văn minh: biến năng lượng, đất đai và khoáng sản khan hiếm thành sức mạnh tính toán thông minh.

  1. Suy nghĩ lại về cơ chế hạ tầng

Trong khi các trung tâm dữ liệu tập trung mở rộng liên tục, một xu hướng khác đang âm thầm hình thành — đó là cố gắng định nghĩa lại cách phối hợp nguồn lực tính toán từ căn bản.

推理去中心化:一种结构性替代

Gonka protocol là ví dụ tiêu biểu cho hướng này. Đây là một mạng lưới phân tán dành riêng cho suy luận AI, với mục tiêu chính là: giảm thiểu tối đa chi phí đồng bộ và đồng thuận của mạng, đồng thời hướng nhiều tài nguyên tính toán nhất có thể vào các tải trọng AI thực sự.

Về mặt quản trị, Gonka áp dụng nguyên tắc “một đơn vị sức mạnh tính toán một phiếu” — quyền quản trị được xác định dựa trên khả năng đóng góp sức mạnh tính toán xác thực, chứ không dựa vào tỷ lệ sở hữu vốn. Về mặt kỹ thuật, giao thức sử dụng các khoảng đo hiệu năng ngắn hạn (gọi là Sprint), yêu cầu các thành viên thể hiện sức mạnh GPU thực qua cơ chế chứng minh công việc dựa trên Transformer (PoW) theo thời gian thực.

Ý nghĩa của thiết kế này là: gần như 100% sức mạnh mạng lưới được hướng vào tải trọng suy luận AI, thay vì tiêu tốn vào duy trì đồng thuận, giao tiếp và các chi phí hạ tầng khác.

Logic kinh tế của tính toán phân tán

Từ góc độ kinh tế, giá trị của mạng lưới tính toán phân tán có thể phân thành ba cấp độ.

Thứ nhất là chi phí. Cấu trúc giá của các nhà cung cấp đám mây tập trung về bản chất bao gồm khấu hao tài sản cố định khổng lồ, chi phí vận hành trung tâm dữ liệu và lợi nhuận cổ đông. Mạng lưới phân tán giúp biến các GPU dư thừa thành tiền, giảm đáng kể các chi phí này. Ví dụ, qua dịch vụ tính phí GonkaGate của Gonka, giá mỗi triệu token chỉ khoảng 0,0009 USD — trong khi các dịch vụ trung tâm như Together AI tính giá khoảng 1,50 USD, chênh lệch hàng nghìn lần.

Thứ hai là khả năng cung ứng linh hoạt. Các nhà cung cấp dịch vụ đám mây tập trung có nguồn cung cố định, mở rộng theo tháng hoặc theo quý. Trong khi đó, các thành viên mạng lưới phân tán có thể tham gia hoặc rút lui linh hoạt theo nhu cầu, phản ứng nhanh hơn với các đỉnh cao của nhu cầu — giống như Amazon Web Services ra đời để đáp ứng nhu cầu cao đột biến trong mùa lễ, các đợt cao trào của suy luận AI cũng cần hạ tầng linh hoạt như vậy.

Thứ ba là chủ quyền. Trong bối cảnh quốc gia, điều này đặc biệt rõ nét. Khi chính phủ một quốc gia phụ thuộc sâu vào một nhà cung cấp đám mây nước ngoài cho dịch vụ công, thì phụ thuộc vào sức mạnh tính toán chính là điểm yếu chiến lược. Mạng lưới phân tán cung cấp khả năng: trung tâm dữ liệu địa phương có thể trở thành nút trong mạng lưới toàn cầu, đảm bảo chủ quyền dữ liệu đồng thời khai thác sức mạnh tính toán toàn cầu để duy trì lợi nhuận bền vững.

  1. Thời điểm tái cấu trúc phân phối giá trị

Quay lại câu hỏi trung tâm của bài viết: Mô hình kinh tế hạ tầng AI hiện tại, sau khi mở rộng quy mô, có thực sự bền vững không?

Câu trả lời là: Với các ông lớn, có thể bền vững; còn với phần còn lại, ngày càng không thể duy trì.

AWS, Azure, Google Cloud đã xây dựng hàng chục năm tích lũy vốn để tạo ra lợi thế cạnh tranh, và trong ngắn hạn, khó có thể bị phá vỡ. Nhưng chính cấu trúc này cũng đồng nghĩa với việc: quyền định giá, quyền truy cập dữ liệu và phụ thuộc hạ tầng đều tập trung vào một số ít các thực thể tư nhân.

Lịch sử cho thấy, mỗi lần độc quyền về hạ tầng công nghệ lớn đều dẫn đến sự xuất hiện của các kiến trúc phân tán thay thế — Internet chính là phản kháng lại độc quyền viễn thông, BitTorrent là cách phá vỡ trung tâm phân phối nội dung, Bitcoin là thách thức sự tập trung trong phát hành tiền tệ.

Việc phân tán hạ tầng AI có thể không chỉ là một lựa chọn về tư tưởng, mà còn là một tất yếu kinh tế — khi chi phí tập trung đủ cao để thúc đẩy người dùng chuyển dịch quy mô lớn, các giải pháp thay thế sẽ bùng nổ. Jensen Huang ví von: “Mỗi cuộc khủng hoảng tài chính đều đẩy nhiều người hơn đến Bitcoin”, và điều này cũng đúng với thị trường sức mạnh tính toán.

DeepSeek ra đời đã chứng minh một điều: Trong thế giới mà các mô hình mã nguồn mở gần như sánh ngang các mô hình độc quyền, chi phí suy luận sẽ trở thành biến số quyết định tốc độ mở rộng ứng dụng AI. Ai có thể cung cấp sức mạnh suy luận với chi phí thấp nhất, độ sẵn sàng cao nhất, người đó sẽ nắm giữ tấm vé vào cuộc chơi này.

Kết luận: Chiến tranh hạ tầng mới chỉ bắt đầu

Cuộc cạnh tranh giai đoạn tiếp theo của AI sẽ không còn dựa vào bảng xếp hạng khả năng mô hình nữa, mà sẽ diễn ra trong cuộc chiến về kinh tế của hạ tầng.

Các ông lớn tập trung có lợi thế về vốn và quy mô, nhưng cũng mang theo gánh nặng chi phí cố định và áp lực định giá. Các mạng lưới phân tán đang xâm nhập thị trường với chi phí cận biên cực thấp, nhưng cần chứng minh khả năng ổn định, dễ sử dụng và quy mô hệ sinh thái đủ để trở thành rào cản thương mại thực sự.

Hai con đường này sẽ tồn tại song song và thúc đẩy lẫn nhau. Sức ép giữa tập trung và phân tán sẽ là một trong những chủ đề cấu trúc đáng theo dõi nhất của ngành AI trong 5 năm tới.

Cuộc chiến về hạ tầng này mới chỉ bắt đầu.

BTC-2,89%
BTT-1,95%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.26KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.27KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.29KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.28KNgười nắm giữ:1
    0.00%
  • Ghim