OpenClaw lần đầu tiên giúp các công ty mô hình cảm nhận được vị ngọt của kinh tế Token.


Ngày 17 tháng 6, GLM-5.2 mở mã nguồn. Lần này khác biệt.
Giấy phép MIT: tự do chỉnh sửa, tự do bán, nghĩa vụ duy nhất là giữ lại tuyên bố bản quyền.
Rủi ro sở hữu trí tuệ được loại bỏ, doanh nghiệp có thể yên tâm tích hợp mô hình vào sản phẩm thương mại của mình, chỉnh sửa cũng không cần phải nộp lại. So với các giao thức lây nhiễm như GPL "dùng mã của tôi thì cũng phải mở nguồn", MIT giống như tháo bỏ rào cản.
Quan trọng hơn — tất cả các mô hình, từ nay bước vào kỷ nguyên suy luận dài hạn.
GLM-5.2 thực sự thay đổi gì?
Thời đại OpenClaw, Agent làm việc là "chạy ngắn" — mỗi lần nhiệm vụ có giới hạn thời gian, lập kế hoạch - thực thi - kết thúc, quy mô KV Cache có thể kiểm soát, áp lực phần cứng chủ yếu là về sức mạnh tính toán.
Suy luận dài hạn của GLM-5.2 là "chạy marathon" — 1 triệu tokens không mất mát, mô hình có thể giữ toàn bộ mã, toàn bộ lịch sử quyết định, toàn bộ ràng buộc trong một nhiệm vụ. Trong thử nghiệm thực tế, xử lý 880.000 tokens trong một lần, gần như đầy đủ cửa sổ.
Thay đổi này có ý nghĩa gì?
Trước đây AI là "hỏi đáp", Token tiêu hao một lần là xong.
Sau GLM-5.2, Agent bắt đầu chạy các nhiệm vụ dài thực sự: phân tích mục tiêu → lập kế hoạch nhiều vòng → xác minh lặp lại → điều chỉnh công cụ → viết mã rồi chạy mã → dựa trên phản hồi để lập kế hoạch lại. Một nhiệm vụ kích hoạt hàng trăm vòng suy luận.
Mỗi vòng đều phải tải toàn bộ ngữ cảnh vào bộ nhớ để tính toán lại.
Liên tục tính toán, liên tục truyền thông, liên tục đọc ghi.
Ba "liên tục" này đã hoàn toàn thay đổi logic định giá phần cứng.
Suy luận Agent dài hạn, lợi ích thực sự là gì?
🥇 HBM
KV Cache theo vòng đối thoại và độ dài ngữ cảnh tăng tuyến tính, nhanh chóng cạn kiệt dung lượng HBM của GPU. Một khi KV Cache rời khỏi bộ nhớ GPU, băng thông giảm từ mức TB/s xuống mức trăm GB/s — vấn đề từ "sức mạnh tính toán" chuyển sang "băng thông bộ nhớ".
Ba nhà sản xuất lớn đã bán hết công suất, thiếu hụt 50%-60%, đến năm 2026 thị trường đạt 54,6 tỷ USD.
🥈 Chip quang/InP
Suy luận dài hạn chạy trong cụm, mỗi vòng cần đồng bộ giữa các card. Nhiệm vụ càng dài, vòng càng nhiều, lượng truyền thông càng khủng khiếp.
Thị trường module quang 2026 đạt 26 tỷ USD, tăng trưởng 60% mỗi năm. Mảng nền InP thiếu hụt trên 70%, giá indium tăng 90% so với cùng kỳ.
🥉 CPU
Nhiệm vụ dài hạn cần liên tục phân tích nhiệm vụ, gọi công cụ, quản lý quy trình, điều phối KV Cache. Những việc này GPU không làm tốt, phải dựa vào CPU.
Tỷ lệ CPU/GPU từ 1:8 tiến gần 1:1, CEO của Intel công khai nói "nhiều CEO các công ty gọi điện thúc giục cung cấp CPU".
❄️ Tản nhiệt bằng dung dịch
Suy luận ngắn là tải xung, suy luận dài là tải liên tục đầy tải. Cùng một card, năng lượng tiêu thụ thực tế của nhiệm vụ dài gấp 3-5 lần so với suy luận ngắn.
Tiêu thụ điện trong tủ rack từ 36kW tăng lên 200kW, làm mát bằng gió không chịu nổi, tản nhiệt bằng dung dịch từ "lựa chọn thay thế" trở thành "bắt buộc".
🔌 Switch
Yêu cầu băng thông của cụm suy luận từ 100G tăng lên 400G, hàng chục nghìn card cần được điều phối. IB và Ethernet tốc độ cao đều hưởng lợi.
📦 Bảng mạch ABF
Cụm mở rộng từ nghìn card lên hàng vạn card, mỗi chip đều cần đóng gói. Mitsui chiếm hơn 90% thị phần màng ABF, thiếu hụt 42% vào năm 2028.
Giá bột mì tăng, bánh mì sẽ càng đắt hơn.
🧪 CCL M9
Mainboard và backplane của cụm suy luận đều cần vật liệu nền tốc độ cao. Giá M9 gấp 10 lần FR4 thông thường, thị trường AI CCL năm 2027 đạt 18,7 tỷ USD, tốc độ tăng trưởng vượt qua module quang.
OpenClaw thắp lửa, GLM-5.2 cung cấp nhiên liệu.
Cái trước giúp các công ty mô hình kiếm được Token đầu tiên, cái sau đưa thị trường này từ phòng thí nghiệm bước vào ngành công nghiệp.
Các thao tác đơn giản vẫn đứng trong bộ nhớ, đứng trong ánh sáng, tận hưởng bong bóng AI.
$MU $SKHYNIX $LITE
TOKEN3,03%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim