Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
CFD
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
CFD
Phái sinh CFD cổ phiếu Hoa Kỳ
Cổ phiếu Hoa Kỳ
Tiếp cận cổ phiếu và quỹ ETF thực của Hoa Kỳ
Cổ phiếu Hongkong
Giao dịch cổ phiếu chất lượng được niêm yết tại Hongkong
Futures cổ phiếu
Đòn bẩy cao, giao dịch 24/7
Cổ phiếu token hóa
Được hỗ trợ bởi tài sản cổ phiếu thực
IPO Access
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
GUSD
Đúc GUSD để nhận lợi suất từ RWA kho bạc
Hoạt động cổ phiếu
Giao dịch cổ phiếu phổ biến và nhận airdrop hấp dẫn
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
IPO Access
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
Bạn trả phí đăng ký cho Claude, công ty module quang học có thể nhận được bao nhiêu?
TÓM TẮT
Một biểu đồ ước tính phân chia chi phí từ khoảng 20 USD hàng tháng của Claude Pro tại Mỹ, phân bổ cho công ty mô hình, điện toán đám mây, GPU, hao mòn, điện năng và chuỗi cung ứng, đang khiến các nhà đầu tư phải xem xét lại cách định giá doanh thu ứng dụng AI.
Biểu đồ này không phải dữ liệu phân chia chính thức của Anthropic, Amazon Cloud hay Nvidia, cũng không thể coi là sổ sách thực tế của bất kỳ công ty nào. Giá trị của nó nằm ở việc đặt ra một câu hỏi nền tảng hơn: phần phí người dùng trả cho ứng dụng AI, có thể tích lũy thành lợi nhuận phần mềm như SaaS truyền thống hay không?
Định giá SaaS truyền thống rõ ràng hơn. Sau khi phần mềm hoàn chỉnh, bán thêm một tài khoản mới thường không tốn nhiều chi phí, lợi nhuận gộp của các công ty phần mềm thuần lành mạnh thường trên 70% thậm chí 80%. Các nhà đầu tư sẵn sàng trả giá cao vì khi doanh thu mở rộng, lợi nhuận có khả năng tiếp tục tăng.
Vấn đề của ứng dụng AI là, mỗi lần người dùng đặt câu hỏi, viết mã, phân tích tài liệu hoặc gọi agent, đều tiêu tốn thời gian GPU, điện năng, băng thông bộ nhớ và tài nguyên đám mây. Bề ngoài là phí hàng tháng cố định, nhưng bên dưới là một chuỗi chi phí biến đổi theo mức sử dụng. Người dùng nhẹ có thể sinh lợi cao, trong khi người dùng nặng, chạy liên tục trong hạn mức hoặc gói dịch vụ liên quan, có thể làm chi phí tăng nhanh.
Vì vậy, biểu đồ phân chia 20 USD không nhằm mục đích xác định công ty nào lấy được bao nhiêu USD, mà là đặt câu hỏi: "Doanh thu ứng dụng AI có tự nhiên bằng doanh thu SaaS hay không?" Các công ty AI muốn chứng minh giá trị của mình với mức cao, không chỉ cần chứng minh người dùng sẵn sàng trả tiền, mà còn phải chứng minh lợi nhuận gộp theo trọng số sử dụng có thể duy trì cải thiện.
Có một chuỗi chi phí suy luận đằng sau phí đăng ký
Sự khác biệt lớn nhất giữa đăng ký AI và phần mềm thông thường là "chi phí biên" của việc sử dụng một lần không còn gần bằng không nữa.
Trong SaaS truyền thống, một nhóm mở thêm tài khoản, nhà cung cấp dịch vụ có chi phí máy chủ, dịch vụ khách hàng và băng thông, nhưng những chi phí này thường không tăng tuyến tính theo mỗi lần nhấp. Chi phí thực sự đắt đỏ là nghiên cứu phát triển ban đầu, bán hàng và thu hút khách hàng. Sau khi sản phẩm mở rộng quy mô, một phần doanh thu mới có thể giữ lại.
Sản phẩm mô hình lớn khác biệt. Người dùng nhập câu hỏi, mô hình sinh ra câu trả lời, quá trình này gọi là suy luận, tức là tính toán thực tế khi mô hình được gọi. Token là đơn vị đo lường cơ bản cho việc đọc và ghi văn bản của mô hình. Người hỏi nhiều hơn, ngữ cảnh dài hơn, nội dung sinh ra phức tạp hơn, tiêu thụ token và sức mạnh tính toán nhiều hơn.
Điều này tạo ra mâu thuẫn giữa chi phí cố định của đăng ký và chi phí biến đổi. Claude Pro tại Mỹ khoảng 20 USD mỗi tháng, giá có thể bị ảnh hưởng bởi khu vực, thuế và điều chỉnh của Anthropic. Người dùng thấy giá cố định, nhưng công ty mô hình phải đối mặt với hành vi sử dụng rất khác nhau. Có người chỉ gửi email, tra cứu thông tin, có người xử lý tài liệu dài, chạy mã hoặc tự động hóa phức tạp hơn.
Biểu đồ phân chia phổ biến cố gắng hình dung rõ ràng điều này: trong 20 USD, một phần dành cho công ty mô hình, phần còn lại trả cho nhà cung cấp điện toán đám mây và tính toán. Chi phí điện năng, vận hành, hao mòn GPU đều nằm trong đó. Các nhà cung cấp GPU sau đó hướng dòng tiền lên Nvidia, TSMC, nhà cung cấp HBM (bộ nhớ băng thông cao), module quang, ODM và các doanh nghiệp liên quan đến điện năng.
"Hao mòn GPU" ở đây có thể hiểu là, GPU đắt tiền không phải là chi phí một lần, mà được phân bổ dần vào chi phí dịch vụ AI dựa trên tuổi thọ, cường độ sử dụng hoặc phương pháp kế toán. Phân bổ thực tế sẽ bị ảnh hưởng bởi hạn mức gói dịch vụ, tỷ lệ người dùng nặng nhẹ, giá nội bộ của nhà cung cấp đám mây, chiết khấu dự phòng, tỷ lệ sử dụng GPU và thời gian hao mòn. Chi phí trung bình không nhất thiết bằng chi phí cận biên.
Nhà đầu tư thực sự cần chú ý đến hướng đi: các công ty ứng dụng AI không chỉ tiết lộ tăng trưởng doanh thu, mà còn phải trả lời liệu chi phí tính toán đằng sau tăng trưởng đó có đồng bộ hay không. Nếu lượng sử dụng mở rộng nhanh hơn cải thiện hiệu quả mô hình, doanh thu đăng ký cao hơn có thể gây áp lực lợi nhuận rõ rệt. Chỉ khi hiệu quả cải thiện đủ nhanh, các công ty mô hình mới có thể gần như trở lại cấu trúc lợi nhuận của phần mềm.
Cơ sở hạ tầng nhận phần doanh thu rõ ràng hơn trước
Trong giai đoạn này, tăng trưởng lượng sử dụng AI trực tiếp đổ vào hạ tầng, chứ không hoàn toàn tích lũy trong tầng ứng dụng.
Dù người dùng sử dụng mô hình trong Claude, ChatGPT, Gemini hay agent nội bộ doanh nghiệp, cuối cùng đều phải dựa vào điện toán, điện năng, bộ nhớ và mạng. Có thể có sự thay thế sản phẩm ở tầng ứng dụng, nhưng các tài nguyên nền tảng lại có tính cứng hơn. Miễn là lượng sử dụng AI tiếp tục tăng, chi tiêu cho đám mây, mua GPU, nhu cầu HBM và điện trung tâm dữ liệu sẽ bị kéo theo.
Đây cũng là lý do các chuỗi hạ tầng như Nvidia, TSMC, SK Hynix liên tục được thị trường định giá lại. Trong những năm gần đây, Nvidia duy trì tỷ suất lợi nhuận gộp cao, dự kiến FY2026 đạt khoảng 71.1% theo GAAP và 71.3% theo không GAAP, các dự báo quý tiếp theo cũng duy trì mức cao. Cần lưu ý, một số quý có thể bị ảnh hưởng bởi các khoản phí đặc biệt, báo cáo tài chính công khai không phải lúc nào cũng thể hiện rõ cấu trúc lợi nhuận của trung tâm dữ liệu AI, nhưng tính khan hiếm của hạ tầng này đã phản ánh rõ trong kết quả kinh doanh.
HBM là phần điển hình nhất trong chuỗi này. Nó không phải bộ nhớ thông thường, mà là thành phần then chốt hỗ trợ tính toán băng thông cao trong bộ gia tốc AI. Khi quy mô mô hình, độ dài ngữ cảnh và yêu cầu suy luận đồng thời tăng lên, sự phụ thuộc vào bộ nhớ băng thông cao của chip AI càng mạnh. Ước tính chuỗi cung ứng cho thấy, tỷ lệ chi phí HBM trong thế hệ chip AI mới tăng lên, đây là lý do các nhà cung cấp như SK Hynix, Samsung, Micron được định giá lại trong chu kỳ AI.
Điện năng và trung tâm dữ liệu cũng từ chi phí nền thành các lĩnh vực đầu tư chính. Năng lượng tiêu thụ cho một truy vấn văn bản thông thường không quá lớn, nhưng các agent phức tạp, ngữ cảnh dài, sinh mã và đa vòng nhiệm vụ sẽ làm tăng lượng tính toán. Đối với nhà cung cấp đám mây và vận hành trung tâm dữ liệu, điều quan trọng không phải là tiêu thụ điện của một lần truy vấn, mà là khi hàng triệu yêu cầu suy luận liên tục diễn ra, tỷ lệ sử dụng cụm, giá điện, làm mát, công suất phòng máy và khả năng kết nối lưới điện đều trở thành chi phí và điểm nghẽn.
Ưu thế của hạ tầng nằm ở việc xác nhận kết quả nhanh hơn. Chi tiêu cho đám mây của các nhà cung cấp AI đã bắt đầu, doanh thu và lợi nhuận gộp của Nvidia thể hiện rõ trong báo cáo tài chính, đơn hàng và giá của HBM cũng sẽ nhanh chóng phản ánh vào lợi nhuận. Giao dịch liên quan đến ứng dụng mô hình chủ yếu dựa trên kỳ vọng tương lai: chuyển đổi đăng ký, tỷ lệ thâm nhập doanh nghiệp, doanh thu API và lợi nhuận từ giảm chi phí trong tương lai.
Hiệu quả cải thiện vẫn là nền tảng chính của các nhà đầu tư dài hạn
Các nhà đầu tư phần mềm và các nhà đầu tư AI không phải không có lý. Trường phái hiệu quả cho rằng, chi phí suy luận cao ngày nay chỉ là hiện tượng của giai đoạn đầu, khi mô hình tối ưu, cache, mô hình nhỏ, chip tự phát triển và tận dụng tốt hơn hệ thống cluster, sẽ liên tục giảm chi phí đơn vị. Miễn là chi phí giảm đủ nhanh, ứng dụng AI vẫn có thể quay trở lại mô hình lợi nhuận cao của phần mềm.
Có cơ sở thực tế cho phản biện này. Một số mô hình chính đã giảm rõ rệt chi phí trên token, ngay cả khi khả năng không đổi hoặc cao hơn. OpenAI từng tiết lộ, chi phí cho mỗi token của GPT-4o mini giảm 99% so với text-davinci-003 ban đầu. Các công ty khác nhau có tốc độ giảm không hoàn toàn giống nhau, Anthropic gần đây thể hiện rõ qua việc nâng cấp cùng giá và phân tầng mô hình, nhưng hướng chung vẫn là cung cấp khả năng mạnh hơn với chi phí thấp hơn.
Các công ty mô hình cũng có nhiều cách để cải thiện hiệu quả kinh tế đơn vị. Giao nhiệm vụ đơn giản cho mô hình nhỏ, tái sử dụng cache cho các yêu cầu thường, giao các nhiệm vụ dài, phức tạp cho mô hình mạnh hơn. Các nhà cung cấp đám mây thì giảm chi phí đơn vị tính toán bằng chip tự phát triển và điều phối cluster. Google có TPU, Microsoft ra Maia dành cho suy luận, Amazon cũng đang thúc đẩy Trainium và Inferentia.
Nếu chỉ nhìn vào tiến bộ kỹ thuật, lợi nhuận của ứng dụng AI vẫn có khả năng cải thiện. Chi phí suy luận rẻ hơn, mô hình tốt hơn, khả năng nén mạnh hơn đều giúp cùng một gói đăng ký 20 USD có thể chứa được nhiều hơn. Người dùng nhẹ, gói doanh nghiệp cao cấp, phân tầng API, giới hạn sử dụng chặt chẽ hơn cũng giúp cải thiện hiệu quả kinh tế chung.
Khó khăn nằm ở chỗ, giảm chi phí không phải là biến số duy nhất. Ứng dụng AI đang chuyển từ các tác vụ đơn giản sang các tải trọng nặng hơn. Trước đây, người dùng chỉ hỏi đáp, chỉnh sửa văn bản, giờ đây nhu cầu ngày càng nhiều về agent mã, xử lý tài liệu dài, video, đa dạng mô hình, tự động hóa doanh nghiệp. Những kịch bản này có giá trị cao hơn, tiêu thụ nhiều hơn. Mô hình càng hữu ích, người dùng càng có xu hướng giao cho nó các nhiệm vụ phức tạp, dài hơn.
Các tranh luận trở nên cụ thể hơn: tốc độ giảm chi phí suy luận, liệu có vượt quá mức tăng của sử dụng và độ phức tạp nhiệm vụ hay không. Nếu chi phí đơn vị giảm nhanh, nhưng trung bình người dùng tiêu thụ nhiều hơn, lợi nhuận gộp của các công ty mô hình vẫn có thể bị áp lực. Ngược lại, nếu các phương pháp routing, cache, chip tự phát triển và phân tầng giá đủ hiệu quả, đăng ký AI có thể dần thoát khỏi đặc tính chi phí cao ngày nay.
Số lượng người đăng ký không phải là tỷ lệ lợi nhuận gộp
Biểu đồ phân chia 20 USD không nên hiểu là kết thúc. Nó chỉ như một lời nhắc nhở về định giá hiện tại: khi thị trường chưa có đủ dữ liệu rõ ràng về lợi nhuận gộp của các công ty mô hình, nhà đầu tư cần giảm kỳ vọng vào giả định "ứng dụng AI tự nhiên bằng SaaS".
Đối với các công ty mô hình chưa niêm yết như OpenAI, Anthropic, rất khó để các nhà đầu tư bên ngoài thấy toàn bộ sổ sách. Tài liệu huy động vốn, các tiết lộ từ đối tác, cấu trúc chi phí đám mây, giá gói doanh nghiệp, tỷ lệ doanh thu API, giới hạn sử dụng đều là manh mối để đánh giá. Dữ liệu thực sự có giá trị không phải là số lượng người dùng trả phí, mà là tỷ lệ người dùng nhẹ và nặng, khách hàng doanh nghiệp sẵn sàng trả giá cao cho sử dụng cao, chi phí đám mây giảm hay không, và chi phí suy luận đơn vị có thể cải thiện lợi nhuận gộp của công ty hay không.
Các công ty niêm yết sẽ phản ánh nhanh hơn qua báo cáo tài chính. Tỷ suất lợi nhuận gộp của Nvidia, tốc độ tăng doanh thu trung tâm dữ liệu, nhu cầu công nghệ tiên tiến của TSMC, giá và lợi nhuận của các nhà cung cấp HBM, mức đầu tư của các nhà cung cấp đám mây đều phản ánh rõ ràng xem lượng sử dụng AI có tiếp tục truyền xuống hạ tầng hay không. Nếu các chỉ số này duy trì mạnh, mà tầng ứng dụng thiếu bằng chứng cải thiện lợi nhuận gộp, thị trường sẽ tiếp tục định giá cao hơn cho hạ tầng.
Cuối cùng, để các công ty mô hình lấy lại mức định giá cao hơn, họ cần chứng minh không chỉ người dùng sẵn sàng trả 20 USD, mà còn rằng sau khi sử dụng nặng, vẫn còn đủ lợi nhuận gộp. Các phân kỳ về giá trong các vòng tới có thể không nằm ở con số ARR chính, mà ở chi phí suy luận, giới hạn gói và giá doanh nghiệp có thể đồng thời phù hợp hay không.
Nhấn để tìm hiểu về các vị trí tuyển dụng của律动BlockBeats
Chào mừng gia nhập cộng đồng chính thức của律动BlockBeats:
Nhóm Telegram theo dõi: https://t.me/theblockbeats
Nhóm Telegram trao đổi: https://t.me/BlockBeats_App
Tài khoản chính thức Twitter: https://twitter.com/BlockBeatsAsia