Xe điện Li Xiang ra mắt mô hình nền tự động hóa thế hệ tiếp theo MindVLA-o1: Nhìn rõ hơn, suy nghĩ sâu hơn

robot
Đang tạo bản tóm tắt

IT之家 ngày 17 tháng 3 đưa tin, hôm nay, người phụ trách mô hình nền tảng của Li Auto là Zhan Kun đã tham dự NVIDIA GTC 2026 và có bài phát biểu chủ đề 《MindVLA-o1:Mở ra mô hình toàn năng —— Khám phá mô hình nền tảng tự động lái thống nhất tầm nhìn-ngôn ngữ-hành động thế hệ tiếp theo》, đồng thời công bố mô hình nền tảng tự động lái thế hệ tiếp theo của Li Auto là MindVLA-o1.

据 giới thiệu, MindVLA-o1 thông qua năm đổi mới kỹ thuật —— hiểu không gian 3D, suy nghĩ đa phương thức, tạo hành vi thống nhất, học tăng cường trong vòng kín và thiết kế phối hợp phần mềm-phần cứng, để xây dựng mô hình nền tảng tự động lái hướng tới trí tuệ cho thế giới vật lý.

Theo IT之家 tìm hiểu, bước đột phá cốt lõi của mô hình này có thể khái quát thành năm khía cạnh sau:

Nhìn chính xác hơn (hiểu không gian 3D): Trước đây, các hệ thống chủ yếu xử lý hình ảnh phẳng, trong khi MindVLA-o1 kết hợp camera và lidar, thông qua bộ mã hóa 3D để chiếc xe có thể cảm nhận độ sâu, khoảng cách và trạng thái chuyển động của vật thể như con người, từ đó thực sự hiểu không gian vật lý ba chiều.

Nghĩ sâu hơn (suy nghĩ đa phương thức): Đây là mô hình đầu tiên có thể “tưởng tượng” tương lai. Thông qua mô hình thế giới ẩn, nó không chỉ nhìn hiện tại mà còn có thể “diễn tập” trước vài giây có thể xảy ra trong không gian ẩn, từ đó đưa ra các quyết định có tính dự báo cao hơn.

Đi vững vàng hơn (tạo hành vi thống nhất): Hệ thống sử dụng kiến trúc VLA-MoE, được trang bị riêng một “chuyên gia hành động”. Nó có thể đồng thời tạo ra tất cả các điểm quỹ đạo khi di chuyển và, thông qua quá trình tối ưu hóa tương tự như “khử nhiễu”, đảm bảo xe chạy vừa mượt mà vừa tuân thủ đúng các quy luật vật lý.

Tiến hóa nhanh hơn (học tăng cường vòng kín): Li Auto đã xây dựng một bộ mô phỏng thế giới mạnh mẽ. Mô hình không chỉ học trên đường phố mà còn có thể thực hiện các bài tập tự rèn luyện quy mô lớn, hiệu quả cao và tối ưu hóa chiến lược trong thế giới ảo, từ đó giảm đáng kể chi phí huấn luyện.

Triển khai hiệu quả hơn (phối hợp phần mềm-phần cứng): Thông qua nghiên cứu sự cân bằng giữa độ chính xác của mô hình và độ trễ của phần cứng, Li Auto đã rút thời gian thiết kế kiến trúc từ vài tháng xuống còn vài ngày, giúp các mô hình lớn phức tạp có thể chạy trơn tru hơn trên chip ở phía xe.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.29KNgười nắm giữ:2
    0.07%
  • Vốn hóa:$2.29KNgười nắm giữ:2
    0.10%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.27KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$2.27KNgười nắm giữ:1
    0.00%
  • Ghim