Chuyển dịch điểm nghẽn công suất của cụm AI 100.000 thẻ: Liên kết quang học làm trung tâm hạ tầng mới như thế nào?

Trong hai năm qua, các cuộc thảo luận về sức mạnh tính toán AI gần như hoàn toàn xoay quanh GPU: thiếu hụt nguồn cung H100, thông số hiệu suất B200, lộ trình kiến trúc GPU thế hệ tiếp theo, tạo thành dòng chính của câu chuyện ngành. Tuy nhiên, khi cụm máy huấn luyện AI vượt qua quy mô nghìn card lên hàng vạn card hoặc cả trăm nghìn card, một giới hạn cấu trúc sâu hơn đang nổi lên — hiệu quả luồng dữ liệu giữa các GPU, đang trở thành giới hạn cuối cùng quyết định hiệu suất tổng thể của cụm.

Kiến trúc sư mạng quang của Tencent, Phó Sĩ Đông, vào đầu năm 2026 chỉ ra rằng, từ kiến trúc Pascal năm 2016 đến kiến trúc Blackwell năm 2024, sức mạnh tính toán AI đã tăng khoảng 1000 lần trong tám năm; sức mạnh suy luận tăng 32 lần trong bốn năm qua, huấn luyện tăng 16 lần. Trong khi đó, băng thông mạng từ 200G nâng lên 800G chỉ tăng 4 lần. Tình trạng mất cân đối này, “sức mạnh tính toán như tên lửa tăng vọt, mạng lưới như đi bộ tiến lên”, khiến tốc độ truyền dữ liệu giữa các nút trở thành điểm nghẽn chính của các cụm hàng vạn hoặc hàng trăm nghìn card, ảnh hưởng nghiêm trọng đến hiệu quả tổng thể và sử dụng tài nguyên của cụm.

Thực tế này đang định hình lại logic đầu tư hạ tầng AI và lựa chọn lộ trình công nghệ. Khi công nghệ liên kết quang học từ việc bù đắp hiệu năng cục bộ trở thành khả năng then chốt hỗ trợ vận hành quy mô lớn của cụm AI, việc hiểu rõ logic kỹ thuật, cấu trúc thị trường và giá trị ngành trở thành vấn đề nền tảng không thể tránh khỏi để đánh giá lĩnh vực sức mạnh tính toán AI. Đồng thời, phía đầu tư cũng đang trải qua một sự chuyển đổi cấu trúc tương tự — từ phân bổ tài sản đơn lẻ sang phối hợp nhiều thị trường, chuỗi giá trị kết nối hạ tầng tính toán và hạ tầng tài chính đang hình thành.

Khó khăn truyền thông của cụm hàng trăm nghìn card: Khoảng cách giữa sức mạnh tính toán và mạng lưới

Hiệu quả của cụm GPU không do sức mạnh đỉnh cao của một GPU quyết định, mà do thời gian cần để tất cả GPU phối hợp tính toán. Trong huấn luyện phân tán mô hình lớn, việc đồng bộ tham số thường xuyên và trao đổi gradient khiến khả năng truyền thông giữa các nút quyết định hiệu quả huấn luyện tổng thể. Trong whitepaper công nghệ CPO của H3C, họ chỉ ra rằng, trong những năm gần đây, tốc độ nâng cao sức mạnh tính toán của một card vượt xa sự tiến bộ của băng thông liên kết mạng, phần lớn các cụm liên tục tăng số lượng GPU, nhưng mở rộng băng thông truyền thông lại chậm hơn, dẫn đến thời gian truyền thông ngày càng chiếm tỷ lệ lớn trong tổng thời gian huấn luyện, GPU phải chờ đợi dữ liệu lâu, hiệu suất hiệu quả chung khó mở rộng theo số lượng GPU.

Hiện tượng này có căn cứ định lượng rõ ràng. Các số liệu của Tencent cho thấy, trong bốn năm qua, sức mạnh huấn luyện tăng 16 lần, sức mạnh suy luận tăng 32 lần, trong khi băng thông mạng chỉ từ 200G nâng lên 800G, tăng 4 lần. Khi quy mô cụm vượt qua hàng nghìn card và tiến tới hàng trăm nghìn card, mô hình truyền thông giữa các GPU không còn đơn thuần là truyền dữ liệu điểm-điểm, mà là hệ thống phức tạp vận hành đồng thời hàng nghìn thậm chí hàng vạn liên kết. Bất kỳ tắc nghẽn hoặc độ trễ nào của một liên kết đều có thể làm chậm toàn bộ vòng lặp huấn luyện.

Bài báo của IEEE công bố tháng 2 năm 2026 xác nhận thêm nhận định này: Khi quy mô mô hình AI tăng lên, liên kết đã trở thành điểm nghẽn then chốt trong các cụm GPU quy mô lớn, mạng phân nhóm truyền thống đối mặt với thách thức ngày càng nghiêm trọng về tiêu thụ năng lượng, chi phí và khả năng mở rộng. Nghiên cứu cho thấy, kiến trúc dựa trên chuyển mạch quang điện có thể giảm tiêu thụ năng lượng của tầng backbone gần 99%, giảm 76% chi phí vòng đời trong tám năm.

Dữ liệu ngành cho thấy, mâu thuẫn cấu trúc này đang thúc đẩy sự mở rộng nhanh chóng của hạ tầng truyền thông quang. UBS ước tính, nhu cầu cáp quang toàn cầu trong năm năm qua chỉ tăng trung bình khoảng 2% mỗi năm, nhưng với việc xây dựng trung tâm dữ liệu AI tăng tốc, nhu cầu ngành trong vài năm tới dự kiến sẽ vượt quá 30% mỗi năm, nhu cầu cáp quang liên quan đến trung tâm dữ liệu có thể đạt hơn 75% tăng trưởng kép. Trước đây, 70-80% nhu cầu cáp quang đến từ nhà mạng viễn thông, UBS dự đoán đến năm 2030, tỷ lệ nhu cầu của doanh nghiệp và trung tâm dữ liệu sẽ vượt quá 80%. Ngành cáp quang đang chuyển đổi từ ngành viễn thông truyền thống sang thành phần cốt lõi của hạ tầng AI.

Liên kết quang: Con đường công nghệ xác định để giải quyết điểm nghẽn sức mạnh tính toán

Đối mặt với khoảng cách giữa sức mạnh tính toán và mạng lưới, công nghệ liên kết quang đang từ giải pháp bổ sung trở thành lựa chọn kiến trúc nền tảng. Mở rộng cụm AI thường diễn ra theo ba chiều: Scale-up (tăng chiều dọc, liên kết tốc độ cao giữa các GPU trong tủ rack), Scale-out (tăng chiều ngang, liên kết giữa các nút trong cụm), Scale-across (liên kết liên vùng, kết nối các trung tâm dữ liệu phân tán về địa lý). Ba chiều này có yêu cầu khác nhau về băng thông, độ trễ, tiêu thụ năng lượng và khoảng cách truyền, nhưng đều chỉ rõ tính không thể thay thế của liên kết quang.

Trong kịch bản Scale-up, liên kết quang chủ yếu thay thế cáp đồng hoặc switch điện, để đạt băng thông cao hơn, độ trễ thấp hơn trong truyền thông nội nút. Ví dụ, NVIDIA NVL576 sử dụng switch Ethernet Spectrum-X dựa trên CPO, với khả năng chuyển mạch 512×200Gbps, gồm 32 engine quang silicon 1.6T, dùng cho các kịch bản Scale-out và Scale-across. Huawei CloudMatrix 384 siêu nút sử dụng kiến trúc liên kết ngang hàng, qua 3168 sợi quang và 6912 module LPO 400G, xây dựng bus liên kết tốc độ cao, kết nối toàn bộ 384 NPU, 192 CPU cùng các tài nguyên lưu trữ, bộ nhớ.

Về lộ trình công nghệ, các gia đình công nghệ “x”PO như LPO, LRO, CPO đang tiến nhanh. Dữ liệu của LightCounting cho thấy, thị trường module quang Ethernet toàn cầu dự kiến năm 2026 tăng 35% so với năm 2025, đạt 18.9 tỷ USD, dự kiến vượt 35 tỷ USD vào 2030, trong đó nhu cầu module quang tốc độ cao 800G, 1.6T sẽ chiếm ưu thế. TrendForce dự đoán, năm 2026, tỷ lệ xuất xưởng module quang 800G trở lên sẽ từ 19.5% của 2024 tăng lên trên 60%, dựa trên ước tính gần 4 triệu đơn hàng TPU của Google, nhu cầu module quang 800G trở lên sẽ vượt 6 triệu chiếc.

Tiêu thụ năng lượng là thách thức cốt lõi của module quang rời. Công nghệ Apollo OCS của Google dùng gương phản xạ nhỏ để kết nối trực tiếp cáp quang, tránh chuyển đổi quang-điện lặp lại gây tiêu hao năng lượng và độ trễ, tiêu thụ điện của switch OCS giảm khoảng 95% so với switch truyền thống. Về độ trễ, chip không quang học THine phù hợp với LPO hoặc CPO trong các kịch bản liên kết quang ngắn, giảm độ trễ 90%, tiết kiệm năng lượng 73%.

Phó viện trưởng Viện Nghiên cứu Viễn thông Trung Quốc, Lý Tuấn Kiệt, vào đầu năm 2026 nhấn mạnh rằng, công nghệ liên kết quang đang từ việc bù đắp hiệu năng cục bộ trở thành khả năng then chốt hỗ trợ vận hành quy mô lớn, linh hoạt, đáng tin cậy của các siêu nút AI. Dù là giải quyết điểm nghẽn tốc độ, giới hạn tiêu thụ năng lượng hay dung lượng, liên kết quang đã trở thành điều kiện tiên quyết để hạ tầng AI tiến tới quy mô hàng nghìn card đến hàng trăm nghìn card.

Chiến lược của Ciena: Từ băng thông viễn thông tập trung vào mạng quang AI

Khi liên kết quang trở thành chủ đề cốt lõi của hạ tầng AI, chiến lược của các nhà cung cấp thiết bị hàng đầu trong lĩnh vực này trở thành cửa sổ quan trọng để hiểu sự phát triển ngành. Ciena, nhà cung cấp hệ thống kết nối tốc độ cao hàng đầu toàn cầu, đang trải qua một bước điều chỉnh chiến lược căn bản.

Trong quý thứ ba tài khóa 2025, Ciena báo cáo doanh thu 1.22 tỷ USD, chủ yếu từ bán các nền tảng quang học và định tuyến. Đồng thời, công ty tuyên bố ngừng phát triển thêm dịch vụ PON băng thông rộng, chuyển hướng đầu tư R&D vào các giải pháp cốt lõi quang học và trung tâm dữ liệu, bao gồm công nghệ quản lý ngoài kênh, cắt giảm 4-5% nhân viên, dự trữ khoảng 90 triệu USD chi phí R&D phi tiền mặt để bù đắp. Ciena dự kiến tăng trưởng trong tương lai chủ yếu đến từ thị trường các nhà cung cấp đám mây quy mô siêu lớn và AI.

Giám đốc điều hành Gary Smith tại cuộc họp báo cáo tài chính cho biết, khách hàng nhà cung cấp dịch vụ đang tập trung đầu tư vào các lĩnh vực có thể tạo hiệu ứng quy mô để đáp ứng tăng trưởng lưu lượng AI, thúc đẩy các yêu cầu hệ thống mới và cơ hội liên kết, cuối cùng mở rộng vào nội bộ trung tâm dữ liệu. Ciena cho biết, các nhà cung cấp đám mây quy mô siêu lớn chiếm khoảng 50% doanh nghiệp của họ, dự kiến đến 2026, cấu trúc khách hàng sẽ tương tự.

Ciena đã đạt thành quả trong việc triển khai hạ tầng AI. Công ty chỉ ra một dự án liên kết GPU khu vực Bắc Mỹ liên quan đến huấn luyện và phân tán địa lý, gồm nền tảng RLS và plugin WaveLogic 6 Nano 800-gig ZR. Ngoài ra, giải pháp quản lý ngoài kênh DCOM của họ giúp các nhà vận hành trung tâm dữ liệu lớn đơn giản hóa vận hành, cài đặt, nâng cấp, giảm tiêu thụ năng lượng và không gian.

Ở góc độ ngành, chiến lược của Ciena phản ánh rõ ràng rằng, nhu cầu mạng quang của trung tâm dữ liệu AI đang tăng từ lượng sang chất. Giám đốc công nghệ hợp tác toàn cầu Jürgen Hatheier của Ciena chỉ ra, thị trường rõ ràng chuyển hướng sang liên kết quang dung lượng cao hơn, đã thấy nhu cầu mạnh mẽ đối với bước sóng 1.6T, dự kiến duy trì đến 2026. Giám đốc tiếp thị sản phẩm mạng quang của Nokia, Rob Shore, dự đoán, năm 2026 sẽ thấy module cắm rắn 800G trở thành tiêu chuẩn kết nối quang cho mạng AI.

Thị trường mạng trung tâm dữ liệu AI đang tăng trưởng theo cấp số nhân. Theo dữ liệu ngành, thị trường này dự kiến tăng từ 10.31 tỷ USD năm 2025 lên 12.8 tỷ USD năm 2026, tăng trưởng hợp đồng kép 24.2%, đến 2030 đạt 30.17 tỷ USD. Trong đó, nhu cầu cáp quang cho AI dự kiến tăng 77% vào 2025, và đến 2029, tỷ lệ tăng trưởng kép trong năm sẽ đạt 26%, vượt xa các ứng dụng phi AI. Ciena đứng ở trung tâm của đường cong tăng trưởng cấu trúc này.

Từ hạ tầng sức mạnh tính toán đến hạ tầng tài chính: Bản đồ giao dịch cổ phiếu của Gate

Sự tiến hóa của hạ tầng không chỉ diễn ra ở cấp độ sức mạnh tính toán, mà còn ở cấp độ phân bổ tài sản. Khi trung tâm dữ liệu AI dựa trên liên kết quang trở thành hạ tầng quyết định hiệu quả cụm GPU, khả năng phân bổ đa tài sản của phía đầu tư cũng cần có hạ tầng hiệu quả tương ứng.

Gate đang tiến bước vững chắc trong lĩnh vực tài chính truyền thống. Tháng 1 năm 2026, nền tảng lần đầu ra mắt chức năng hợp đồng chênh lệch TradFi, bao gồm vàng, ngoại hối, chỉ số chứng khoán, hàng hóa và cổ phiếu phổ biến. Tháng 3 mở rộng sang token cổ phiếu và ETF đòn bẩy. Tháng 6, Gate hợp tác chiến lược với Alpaca, chính thức ra mắt dịch vụ giao dịch cổ phiếu thực.

Hiện tại, Gate hỗ trợ hơn 10.000 cổ phiếu Mỹ và ETF, bao gồm các công ty niêm yết trên NYSE, NASDAQ, vượt xa phần lớn nền tảng token hóa cổ phiếu chỉ hỗ trợ vài trăm loại tài sản. Người dùng có thể dùng USDT tham gia đầu tư vào thị trường chứng khoán Mỹ chính thống, với lô nhỏ 0.01 cổ phiếu, cho phép đầu tư cổ phiếu hàng đầu Mỹ với số tiền chỉ từ 1 USD.

Về công nghệ và hợp tác, Gate kết nối với các nhà môi giới hợp pháp có giấy phép Broker-Dealer và đủ điều kiện thanh toán bù trừ của Mỹ, kết nối trực tiếp với NYSE và NASDAQ. Mỗi cổ phiếu được hỗ trợ bởi tài sản thực được quản lý độc lập qua hệ thống DTC, không phải là sản phẩm phái sinh hoặc RWA trên chuỗi. Người nắm giữ cổ phần tự động hưởng các quyền lợi như cổ tức, quyền mua cổ phiếu, tách cổ phiếu.

Xét theo xu hướng ngành, tích hợp giao dịch cổ phiếu của các nền tảng lớn là xu hướng rõ ràng. Dữ liệu cho thấy, 73% nhà giao dịch tiền mã hóa đồng thời nắm giữ tài sản truyền thống. Cách làm của Gate qua hạ tầng tuân thủ, thực hiện giao dịch cổ phiếu thực, không phải là biểu diễn tổng hợp hoặc token hóa, đảm bảo người dùng nhận được giá thực và thanh toán thực. Kết hợp các sản phẩm hợp đồng chênh lệch, Gate đang chuyển từ sàn giao dịch tài sản mã hóa đơn thuần sang trung tâm đa tài sản kết hợp tài chính truyền thống và phái sinh.

Sự tiến hóa này phù hợp với xu hướng macro của RWA (tài sản thực) token hóa. Tháng 9 năm 2025, Gate chính thức ra mắt khu vực Ondo, giới thiệu cổ phiếu token hóa của Apple, Tesla, Microsoft và các công ty danh tiếng khác. Tổng giá trị khóa của RWA đã vượt quá 15.7 tỷ USD, trong đó Ondo Finance chiếm khoảng 1.66 tỷ USD, đứng thứ ba toàn cầu. Từ cổ phiếu thực, cổ phiếu token hóa đến hợp đồng chênh lệch cổ phiếu, Gate đang xây dựng một kênh phân bổ đa tầng, đa dạng các dạng tài sản.

Kết luận

Con đường phát triển của công nghệ liên kết quang rõ ràng chỉ ra một thực tế cơ bản: sức mạnh cạnh tranh của trung tâm dữ liệu AI đang chuyển từ chỉ số sức mạnh GPU đơn thuần sang các chỉ số hiệu quả hệ thống. Mạng lưới không còn chỉ là lớp hỗ trợ phụ của cụm sức mạnh tính toán, mà là điều kiện tiên quyết để cụm hàng vạn card có thể phát huy toàn bộ sức mạnh lý thuyết của mình. Trong logic này, giá trị chiến lược của các doanh nghiệp hạ tầng mạng quang đang được thị trường đánh giá lại — quyết định của Ciena chuyển hướng toàn bộ sang mạng quang AI chính là minh chứng rõ ràng nhất cho xu hướng này.

Đồng thời, sự tiến hóa của hạ tầng đầu tư cũng không thể bỏ qua. Khi sức mạnh tính toán AI trở thành yếu tố sản xuất cốt lõi của kỷ nguyên số, khả năng kết nối hiệu quả yếu tố sản xuất này với vốn toàn cầu, nền tảng giá trị của nó cũng đang dịch chuyển một cách hệ thống. Từ sức mạnh tính toán đến mạng lưới, từ phần cứng đến tài sản, điểm giao thoa của công nghệ và đổi mới tài chính chính là nơi sinh ra các cơ hội cấu trúc tập trung.

RWA-1,63%
ONDO-5,33%
TSLA-1,25%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim