Vũ Thụ xác nhận một xu hướng mới: Chiến trường cốt lõi của trí thông minh thực thể không chỉ là mô hình.

robot
Đang tạo bản tóm tắt

Cuộc cạnh tranh về trí tuệ nhúng đang bước vào giai đoạn mới. Sau khi Unitree phát hành mô hình lớn WVLA2.0 và hoàn thành trình diễn thực tế không cần điều khiển từ xa, ngành công nghiệp càng nhận thức rõ: rào cản cốt lõi của cuộc đua này không chỉ đơn thuần dựa vào quy mô mô hình, mà bao gồm khả năng toàn diện về thiết kế kiến trúc độ trễ thấp, tích hợp phần mềm và phần cứng, cũng như tích lũy dữ liệu bản thể.

Theo báo cáo nghiên cứu của Nomura International công bố ngày 28 tháng 6, các nhà phân tích đã đến thăm Unitree vào ngày 15 tháng 6. Trong phần trình diễn, robot G1 trang bị WVLA2.0 (World-model Vision-Language-Action) đã hoàn thành sáu nhiệm vụ liên tiếp một cách tự chủ trong môi trường hội nghị bị nhiễu, không cần điều khiển từ xa, với chu trình suy luận khoảng 90ms, tương đương khoảng mười lần lặp mỗi giây. Đây là phiên bản đầu tiên có tiềm năng triển khai thương mại sau hai năm nghiên cứu và phát triển của Unitree. Ban quản lý xác định sản xuất công nghiệp – lắp ráp động cơ khớp, cấp và tháo phôi, xử lý đồ gá và kẹp – là các kịch bản thương mại hóa sớm nhất, đồng thời coi dữ liệu vận hành thực tế quy mô lớn từ đội robot toàn cầu là tài sản cốt lõi.

Báo cáo của Nomura cũng trình bày khung kiến trúc NeuralAxis do NXP công bố tại COMPUTEX 2026. Khung này do Chủ tịch kiêm CEO của NXP, Rafael Sotomayor, chủ trì đề xuất, với luận điểm cốt lõi rất phù hợp với lộ trình kỹ thuật của Unitree – nút thắt thực sự của AI vật lý không nằm ở quy mô suy luận của mô hình ngôn ngữ, mà ở khả năng xây dựng lớp điều khiển biên có độ trễ thấp tới 40ms tương tự phản xạ tủy sống của con người.

Ý nghĩa trực tiếp của những tiến triển trên đối với nhà đầu tư là: Cục diện cạnh tranh của trí tuệ nhúng đang chuyển từ "mô hình của ai mạnh hơn" sang "hệ thống của ai hoàn chỉnh hơn". Hào phòng thủ mà Unitree xây dựng từ tích hợp tự phát triển toàn diện kết hợp lợi thế dữ liệu bản thể là điều mà các nhà cung cấp mô hình thuần đám mây khó có thể sao chép.

NeuralAxis: Định nghĩa lại ranh giới kiến trúc hệ thống của AI vật lý

Khung NeuralAxis của NXP lấy hệ thần kinh con người làm mẫu, phân tách logic điều khiển AI vật lý thành ba cấp độ tách rời nhưng phối hợp: Lớp suy luận tương ứng vỏ não (độ trễ khoảng 300ms), lớp điều phối tương ứng tiểu não (chịu trách nhiệm điều khiển vận động và cân bằng), và lớp phản xạ tương ứng tủy sống – độ trễ thấp tới 40ms, triển khai ở biên gần bộ truyền động.

Đối với robot hình người, khung này có ý nghĩa sâu sắc nhất.

NeuralAxis chủ trương thay thế "bộ não trung tâm" tập trung bằng bộ xử lý phản xạ phân tán – triển khai khả năng ra quyết định tự chủ cục bộ tại các khớp, bàn tay và bàn chân, thực hiện các hành động như kiểm soát lực nắm, cân bằng mắt cá chân tại chỗ, và hoàn thành chuỗi phục hồi cân bằng, bắt, tư thế và dáng đi trong vòng 40ms. Việc tách rời suy luận và điều khiển vận động còn cho phép bổ sung kỹ năng mới liên tục trong khi duy trì sự ổn định vận động.

Phần mở rộng thương mại của khung này cũng đáng chú ý. Khảo sát ngành của Nomura cho thấy, so với giải pháp tự động hóa truyền thống, kiến trúc NeuralAxis có thể mang lại cải thiện đáng kể về hiệu suất sản xuất, doanh số robot chẩn đoán cũng dự kiến tăng mạnh. Ngoài ra, cùng một kiến trúc có thể nén độ trễ end-to-end của drone xuống dưới 20ms, và phân tầng logic điều khiển của ô tô định nghĩa bằng phần mềm thành các khu vực thực thi suy luận, điều phối và an toàn quan trọng.

WVLA2.0: Lộ trình hạ cánh của tích hợp mô hình và cộng tác phần mềm-phần cứng

Lộ trình kỹ thuật của WVLA2.0 từ Unitree thể hiện sự khác biệt rõ rệt so với xu hướng chính thống trong ngành.

Đa số các giải pháp tương tự đặt cược vào sinh end-to-end thuần VLA (Thị giác-Ngôn ngữ-Hành động), trong khi WVLA2.0 kết hợp khả năng dự đoán của mô hình WMA (World-Model Action) với sinh hành động của VLA, nâng cấp toàn diện về hiểu tác vụ cấp cao, suy luận ngữ nghĩa không gian 2D/3D, sinh hành động với ràng buộc động lực học và khả năng chống nhiễu.

Về mặt cảm nhận, hệ thống tích hợp bốn luồng thị giác song song: một camera độ sâu RealSense, một LiDAR Livox MID360, và hai camera bên, xây dựng biểu diễn không gian 360 độ, với độ trễ cập nhật vị trí dưới 10ms trong điều kiện nhiễu. Về thiết kế cộng tác phần mềm-phần cứng, các tham số hành động sau suy luận được gửi qua bus CAN đến 23 bậc tự do của khớp G1, nhờ vào mô-đun điều khiển vận động "tiểu não" tự phát triển, sai số định vị khi một tay nắm vật dưới 2kg có thể được kiểm soát trong vòng 5mm.

Về kiến trúc tính toán, WVLA2.0 nén sức mạnh tính toán biên xuống dưới 100 TOPS, chạy hoàn toàn trên NVIDIA Jetson Orin NX (NVDA US, chưa được xếp hạng) trang bị trên G1 EDU, không cần phụ thuộc vào đám mây. Ban quản lý cho biết, thiết kế này tránh rủi ro gián đoạn nhiệm vụ do độ trễ mạng hoặc mất kết nối.

Chuyển đổi mô hình dữ liệu: "Thu thập không bản thể" trở thành xu hướng chính

Sự thay đổi mô hình thu thập dữ liệu là một tín hiệu quan trọng khác của báo cáo này.

Trình diễn của Unitree cho thấy, trong một lần ghi hình duy nhất không có sự can thiệp điều khiển từ xa, G1 có thể tự chủ hoàn thành nhiều nhiệm vụ liên tiếp trong môi trường bị nhiễu, điều này có nghĩa là "thu thập dữ liệu không bản thể" đang trở thành mô hình chủ đạo trong sản xuất dữ liệu của trí tuệ nhúng, tức robot dựa vào cảm nhận và quyết định của chính mình để tích lũy dữ liệu, thay vì phụ thuộc vào ghi chú điều khiển từ xa của con người.

Khảo sát ngành của Nomura cũng chỉ ra những hạn chế hiện tại: Hệ thống vẫn tồn tại điểm mù và khoảng trống cảm nhận phía sau, tốc độ thực thi chậm, độ chính xác thao tác tinh tế chưa đủ, và thiếu dữ liệu kiểm tra tỷ lệ thành công liên tục định lượng. Những điểm yếu này cũng xác định ranh giới ưu tiên của thương mại hóa trong ngắn hạn.

Ban quản lý dựa trên đó đã vạch ra lộ trình hạ cánh theo giai đoạn: Sản xuất công nghiệp (lắp ráp động cơ khớp, cấp/tháo phôi, xử lý đồ gá và kẹp) được xác định là điểm hạ cánh sớm nhất vì nhà máy riêng của Unitree có thể cung cấp vòng lặp dữ liệu; tiếp theo là phân loại logistics và lắp ráp 3C linh hoạt; các kịch bản chăm sóc gia đình và y tế do môi trường mở phi cấu trúc khó khăn hơn đáng kể, được xác định là mục tiêu dài hạn hơn.

Tích hợp toàn diện: Hai chiều của rào cản khác biệt của Unitree

Kết luận cốt lõi của báo cáo Nomura có thể tóm gọn thành một nhận định: Trong quá trình thương mại hóa trí tuệ nhúng, khả năng mô hình quan trọng, nhưng không phải là biến số quyết định duy nhất.

Ban quản lý Unitree định nghĩa năng lực cạnh tranh khác biệt của công ty ở hai cấp độ: Thứ nhất là khả năng tích hợp tự phát triển toàn diện từ cảm nhận, mô hình đến điều khiển vận động; thứ hai là khối lượng dữ liệu vận hành thực tế quy mô lớn tích lũy từ đội robot toàn cầu. Hai tài sản này củng cố lẫn nhau – phần cứng tự phát triển tạo ra dữ liệu độc quyền, dữ liệu nuôi dưỡng lặp mô hình, tạo thành vòng lặp khép kín mà các nhà cung cấp mô hình đám mây khó có thể can thiệp.

Từ góc nhìn cục diện cạnh tranh thị trường, khung NeuralAxis và logic hạ cánh của WVLA2.0 cùng chỉ đến một kết luận: Chiến trường cốt lõi của trí tuệ nhúng đang diễn ra đồng thời ở lớp kiến trúc hệ thống và lớp dữ liệu. Đối với nhà đầu tư, chiều đánh giá các người tham gia đường đua cần được mở rộng từ "khả năng mô hình" đơn lẻ sang khả năng tích hợp hệ thống hoàn chỉnh hơn và quy mô tích lũy dữ liệu bản thể.


Nội dung tuyệt vời trên đến từ Bàn giao dịch Zhuifeng.

Để có giải thích chi tiết hơn, bao gồm giải thích thời gian thực, nghiên cứu trực tiếp, vui lòng tham gia [**Bàn giao dịch Zhuifeng ▪ Thành viên năm**]

![](https://img-cdn.gateio.im/social/moments-f187f887a1-07b7e18c28-8b7abd-62a40f)

Tuyên bố miễn trách nhiệm và điều khoản

          

            Thị trường có rủi ro, đầu tư cần thận trọng. Bài viết này không cấu thành lời khuyên đầu tư cá nhân, cũng không xem xét đến mục tiêu đầu tư, tình hình tài chính hoặc nhu cầu cụ thể của người dùng cá biệt. Người dùng nên xem xét liệu bất kỳ ý kiến, quan điểm hoặc kết luận nào trong bài viết có phù hợp với tình hình cụ thể của họ hay không. Đầu tư dựa trên bài viết này, rủi ro tự chịu.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim