Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Launchpad
Đăng ký sớm dự án token lớn tiếp theo
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Xây dựng cụm suy luận AI tự chủ đầu tiên với 1000 GPU, Cloudminds đã tạo ra một mẫu cho "mô hình quốc gia - chip quốc gia"
Cloud Tian Lihui (688343.SH) lại giành được hợp đồng lớn trị giá 420 triệu nhân dân tệ.
Vào ngày 12 tháng 3, theo thông tin đấu thầu công khai, Cloud Tian Lihui đã trúng thầu dự án xây dựng hạ tầng cơ sở vật chất mới về năng lực sản xuất chất lượng cao dựa trên công nghệ AI thâm nhập của thành phố Zhanjiang (gọi tắt là “Dự án Zhanjiang”), với số tiền trúng thầu là 420 triệu nhân dân tệ. Dự án sẽ dựa trên card tăng tốc suy luận AI nội địa tự phát triển của Cloud Tian Lihui để xây dựng cụm máy chủ AI suy luận hàng nghìn card nội địa. Cụm máy chủ dự kiến sẽ tích hợp các mô hình lớn nội địa như DeepSeek, nhằm cung cấp khả năng AI tiện lợi, chi phí thấp hơn cho các lĩnh vực chính phủ, công nghiệp và các ứng dụng liên quan.
Báo cáo nhanh về kết quả hoạt động năm 2025 của Cloud Tian Lihui cho thấy, trong năm qua, công ty đạt doanh thu 1,308 tỷ nhân dân tệ, tăng 42,57% so với cùng kỳ năm trước; lỗ ròng thuộc về cổ đông công ty mẹ là 402 triệu nhân dân tệ, thu hẹp 30,50% so với cùng kỳ. Việc nhận thầu dự án hạ tầng tính toán trị giá 420 triệu nhân dân tệ tại thời điểm này không chỉ là minh chứng mạnh mẽ cho khả năng thương mại hóa chip tự phát triển của công ty, mà còn trực tiếp chuyển hóa thành động lực tăng trưởng liên tục cho kết quả kinh doanh trong tương lai của công ty.
Tuy nhiên, đối với Cloud Tian Lihui, ý nghĩa của dự án Zhanjiang còn vượt xa hơn cả đóng góp về tài chính, đó còn là biểu tượng tiêu chuẩn quan trọng. Khi trí tuệ nhân tạo từ phòng thí nghiệm bước vào giai đoạn sâu của ngành công nghiệp, giá trị của năng lực tính toán không còn đơn thuần là chỉ số xếp hạng, mà là khả năng thúc đẩy năng suất phổ quát cho hàng nghìn ngành nghề. Từ góc độ này, dự án Zhanjiang không chỉ là một đòn bẩy thúc đẩy doanh thu ngắn hạn, mà còn là chiến trường then chốt để Cloud Tian Lihui chứng minh năng lực tự phát triển, chiếm lĩnh vị thế cao trong ngành.
Là cụm máy chủ suy luận AI nội địa hóa toàn diện đầu tiên, dự án Zhanjiang không chỉ là biểu tượng cho việc thương mại hóa quy mô lớn năng lực suy luận AI của Cloud Tian Lihui, mà còn là sân thử nghiệm tốt nhất cho sự hợp nhất sâu sắc giữa “Mô hình quốc gia” và “Chip quốc gia”, giúp công ty liên tục tiến tới mục tiêu mở rộng quy mô lên hàng nghìn card.
Khi trọng tâm ngành công nghiệp chuyển từ đỉnh cao huấn luyện sang chi phí suy luận, ai có thể cung cấp khả năng suy luận quy mô lớn ổn định với chi phí thấp hơn sẽ chiếm lợi thế trong cuộc đua AI lần tới. Cước bộ của Cloud Tian Lihui tại Zhanjiang chính là một bước đi chiến lược quan trọng hướng tới kỷ nguyên suy luận.
Nhu cầu năng lực AI hướng tới “Ưu tiên suy luận”
Khác với mô hình xây dựng trung tâm trí tuệ nhân tạo trong nước trước đây, vốn phổ biến theo phương thức “Huấn luyện và suy luận tích hợp”, dự án tại Zhanjiang của Cloud Tian Lihui lần này chọn con đường công nghệ tập trung hơn — tập trung vào cụm máy chủ suy luận AI chuyên biệt cho nhiệm vụ suy luận, chủ yếu hướng tới các ứng dụng ngành nghề khác nhau, nhằm cung cấp hỗ trợ trực tiếp cho quá trình chuyển đổi AI của các ngành truyền thống.
Chuyển hướng này thực chất là một cuộc cách mạng sâu sắc trong logic ngành công nghiệp AI.
Hệ thống năng lực tính toán AI có thể chia thành hai phần chính: năng lực huấn luyện và năng lực suy luận. Trong đó, năng lực huấn luyện quyết định khả năng xây dựng mô hình từ 0 đến 1, chú trọng vào khả năng tính toán tuyệt đối; còn năng lực suy luận chủ yếu là sử dụng các mô hình mạng neural đã huấn luyện để thực hiện dự đoán suy luận, nhấn mạnh tính thực dụng, yêu cầu về năng lực tính toán thấp hơn, tập trung vào độ trễ thấp và tiêu thụ điện năng thấp.
Trong vài năm qua, điểm nóng của ngành chủ yếu tập trung vào cuộc đua về quy mô tham số của các mô hình lớn, với các mô hình hàng trăm tỷ, nghìn tỷ, thậm chí hàng nghìn tỷ tham số lần lượt ra đời, các công ty lớn đều tranh nhau chiếm lĩnh đỉnh cao về khả năng mô hình. Tuy nhiên, khi khả năng của mô hình ngày càng trưởng thành, ngành công nghiệp bắt đầu thường xuyên đặt câu hỏi thực tế hơn: Mô hình mạnh như vậy, thực sự có thể tạo ra giá trị trong những bối cảnh nào?
Vì vậy, năng lực suy luận ngày càng được chú trọng hơn. Dù là SeeDance nổi bật trong dịp Tết Nguyên đán, hay “Lươn nhỏ” đang được thảo luận rộng rãi gần đây, hay các ứng dụng AI Agent liên tục ra mắt trong các ngành, đều không thể tách rời khỏi sự hỗ trợ của năng lực suy luận. Theo dự báo của tổ chức phân tích thị trường Gartner, đến năm 2026, khoảng 55% chi tiêu cho hạ tầng đám mây chuyên dụng AI sẽ dành cho các tải trọng công việc suy luận.
Điều này chính xác là lợi thế của Cloud Tian Lihui. Công ty chip nội địa này đã tập trung nhiều năm vào lĩnh vực chip suy luận, với kiến trúc “Xây dựng năng lực tính toán” sáng tạo, đã đạt được khả năng mở rộng linh hoạt năng lực tính toán dưới công nghệ tiên tiến nội địa, và đã ra mắt các dòng chip “DeepWorld”, “DeepForce”, “DeepSky” hướng tới các lĩnh vực biên, trí thông minh thể chất, đám mây.
Nhờ đó, Cloud Tian Lihui mới có thể đáp ứng tốt hơn các yêu cầu của dự án Zhanjiang.
Ứng dụng suy luận mô hình lớn đòi hỏi phải đáp ứng đồng thời các yêu cầu về xử lý song song cao, thông lượng lớn và độ trễ thấp. Đồng thời, khi độ dài ngữ cảnh của mô hình lớn ngày càng tăng, nhiều trạng thái trung gian cần được lưu trữ dưới dạng KV Cache (bộ nhớ đệm khóa-giá trị). Do đó, ngành công nghiệp đều cho rằng, trong tương lai, điểm nghẽn hiệu suất của hệ thống suy luận sẽ ngày càng đến từ hiệu quả truy cập dữ liệu, chứ không chỉ là khả năng tính toán.
Trong bối cảnh này, thiết kế phối hợp giữa năng lực tính toán, lưu trữ và mạng lưới đang dần trở thành sức mạnh cạnh tranh quan trọng của hạ tầng AI.
Cụm máy chủ suy luận hàng nghìn card được xây dựng dựa trên ý tưởng này. Cụm này sử dụng chip suy luận AI tự phát triển của Cloud Tian Lihui, và trong kiến trúc hệ thống đã xác định rõ hướng “Ưu tiên tối ưu hóa Prefill, cân nhắc Decode”. Nhờ cấu hình tập trung vào tài nguyên tính toán và băng thông bộ nhớ trong thiết kế chip, hệ thống vẫn duy trì hiệu quả thông lượng cao trong các kịch bản suy luận ngữ cảnh dài.
Về mặt kết nối mạng, Cloud Tian Lihui sử dụng kiến trúc kết nối tốc độ cao thống nhất, xây dựng mạng vật lý cụm bằng mạng quang 400G, để đạt được truyền thông băng thông cao, độ trễ thấp giữa các nút. Về khả năng triển khai, kiến trúc này có thể mở rộng quy mô từ vài chục card trong một nút đơn đến hàng nghìn card trong cụm, phù hợp với các yêu cầu khác nhau của các ứng dụng AI.
Thông qua tối ưu nhiều lớp về kiến trúc chip, kết nối mạng và điều phối hệ thống, cụm suy luận này đã tạo ra lợi thế rõ rệt về hiệu quả tổng thể và kiểm soát chi phí, cung cấp giải pháp năng lực tính toán kinh tế hơn cho các ứng dụng AI quy mô lớn.
Đưa chi phí của hàng trăm tỷ Token xuống còn một xu
Đối với Cloud Tian Lihui, việc triển khai dự án Zhanjiang chỉ mới là bước khởi đầu.
Khi các mô hình lớn dần bước vào giai đoạn ứng dụng, điểm chú ý của ngành chuyển từ “đỉnh cao năng lực” sang “hiệu quả chi phí trên đơn vị”. Nói cách khác, trong tương lai, một trong những chỉ số cạnh tranh quan trọng của ngành AI không chỉ là khả năng của mô hình, mà còn là ai có thể cung cấp khả năng suy luận quy mô lớn ổn định với chi phí thấp hơn.
Là nhà tiên phong trong lĩnh vực chip suy luận, Cloud Tian Lihui có nhận thức rõ ràng về điều này. Tháng 2 năm nay, công ty đã chính thức công bố kế hoạch phát triển các chip năng lực tính toán lớn trong 3 năm tới, nhằm giảm chi phí suy luận hàng triệu Token mỗi năm theo hai chữ số.
Trong đó, chip siêu nút thế hệ đầu P sẽ ra mắt trong năm nay, tối ưu hóa cực đại cho các kịch bản suy luận Prefill với ngữ cảnh dài triệu token, đạt hiệu suất gần như H100; tiếp theo, vào năm 2027, Cloud Tian Lihui sẽ phát triển chip siêu nút thế hệ đầu D để đạt độ trễ cực thấp trong suy luận Decode; cuối cùng, vào năm 2028, công ty sẽ phát triển thế hệ thứ hai của chip siêu nút D, nhằm tối ưu toàn diện hiệu năng của Prefill và Decode thông qua hợp tác hệ thống, hướng tới mục tiêu độ trễ suy luận dưới mili giây.
Dự án đã được vạch rõ, nhưng dù có kế hoạch công nghệ lớn đến đâu, cuối cùng đều cần có các kịch bản thực tế để kiểm chứng giá trị thương mại. Thiết kế chip có thực sự phù hợp với nhu cầu ngành không? Phân bổ tài nguyên cho Prefill và Decode có đạt hiệu quả tối ưu trong tải trọng thực tế không? Áp lực truy cập dữ liệu từ KV Cache sẽ được giảm thiểu hiệu quả như thế nào trong quy mô hàng nghìn card? Những câu hỏi này không thể có câu trả lời cuối cùng trong phòng thí nghiệm, mà phải được kiểm nghiệm trong môi trường ngành thực tế.
Vì vậy, đối với Cloud Tian Lihui, dự án Zhanjiang không chỉ là một dự án bàn giao đơn thuần, mà còn là một cuộc diễn tập chiến đấu thực tế cho lực lượng công nghệ chủ lực.
Dự kiến, dự án Zhanjiang sẽ xây dựng theo 3 giai đoạn, tất cả đều sử dụng card tăng tốc suy luận AI nội địa tự phát triển của Cloud Tian Lihui. Giai đoạn một sẽ triển khai card suy luận X6000 của công ty; giai đoạn hai và ba sẽ trang bị các dòng chip mới nhất của công ty. Trong đó, dự kiến chip Prefill đầu tiên DeepVerse 100 của Cloud Tian Lihui sẽ hoàn thành thử nghiệm mạch trong năm nay, và dự kiến sẽ được triển khai sớm trong cụm Zhanjiang.
Song song đó, cụm suy luận hàng nghìn card của dự án Zhanjiang còn thể hiện khả năng triển khai linh hoạt cực kỳ mạnh mẽ. Trong kiến trúc điển hình, một cụm hàng nghìn card thường gồm nhiều cấp mở rộng: từ một nút đơn 8 card, 32 card, đến các siêu nút 64 card hoặc hàng trăm card, rồi mở rộng quy mô sang các cụm lớn liên nút. Thông qua vận hành thực tế của hệ thống quy mô này, có thể kiểm chứng đầy đủ các công nghệ then chốt như liên kết giữa các card, truyền thông giữa các nút và cân bằng tải, từ đó tích lũy kinh nghiệm cho việc xây dựng các hệ thống năng lực tính toán AI quy mô lớn hơn trong tương lai của Cloud Tian Lihui.
Trong kế hoạch dài hạn, Cloud Tian Lihui đề ra “Kế hoạch 1001”, với mục tiêu dài hạn là “trăm tỷ token chỉ một xu”, liên tục tối ưu hóa chip và hệ thống để giảm chi phí suy luận mô hình lớn.
Nếu mục tiêu này trở thành hiện thực, AI sẽ thực sự trở thành hạ tầng cơ bản như nước và điện, chảy tràn trong hàng trăm nghìn ngành nghề. Đối với Cloud Tian Lihui, người tiên phong trong lĩnh vực suy luận, đây chính là thời kỳ hoàng kim của “người bán nước”.