Stanford cho phép AI của cánh tay robot trực tiếp điều khiển drone: không cần huấn luyện lại vẫn có thể bắt đồ, tự động định hướng

robot
Đang tạo bản tóm tắt

Xảy ra điều gì

Nhóm Stanford đã làm một điều thú vị: lấy một mô hình VLA được đào tạo hoàn toàn trên dữ liệu của cánh tay cơ khí cố định, để nó điều khiển máy bay không người lái, lấy đồ vật. Giải pháp của họ được gọi là AirVLA, dựa trên π₀ VLA, đã thêm một lớp hướng dẫn vật lý “nhận thức tải” để thích ứng với động lực học bay, và sau đó sử dụng 3D Gaussian Splatting để tạo dữ liệu tổng hợp bổ sung mẫu điều hướng.

Số liệu chạy ra

  • Tỷ lệ thành công điều hướng: 100%
  • Tỷ lệ thành công lấy/đặt: 50%
  • Tỷ lệ thành công cho nhiệm vụ dài nhiều bước: 62%

Điều quan trọng là: mô hình cốt lõi không thay đổi. Điều này rất quan trọng cho việc triển khai thực tế - hoàn toàn đào tạo lại vừa tốn kém vừa chậm.

Tại sao mô hình cánh tay cơ khí không thể bay trực tiếp

VLA có khả năng chuyển giao giữa các nền tảng trong việc “hiểu cảnh vật + hiểu nhiệm vụ”, nhưng động lực học điều khiển cơ bản không thể chuyển trực tiếp:

  • Dữ liệu cánh tay cơ khí mặc định môi trường không di chuyển nhiều
  • Máy bay không người lái là hệ thống thiếu điều khiển, tích lũy sai số rất nhanh, không cẩn thận có thể rơi
  • Các quy luật vật lý và ràng buộc điều khiển giữa hai bên hoàn toàn khác nhau

Họ đã giải quyết như thế nào

Hai ý tưởng cốt lõi:

  1. Thêm ràng buộc vật lý trong quá trình suy luận: không đưa động lực học mới vào mô hình, mà sửa đổi trực tuyến theo quy luật vật lý ở giai đoạn đầu ra
  2. Sử dụng Gaussian Splatting để tạo dữ liệu điều hướng: không cần phải chạy khắp nơi để thu thập dữ liệu từ máy thật

Cách tiếp cận “thêm mô-đun vào mô hình cơ bản, không đào tạo lại hoàn toàn từ đầu” nhất quán với hướng đi của AIR-VLA, DroneVLA, nhưng điểm tiếp cận khác nhau.

Ai sẽ thấy điều này hữu ích

Các công ty thực hiện các hoạt động trên không gian (logistics, kiểm tra, cứu hộ) có thể sẽ quan tâm:

  • Không cần phải tích lũy một đống dữ liệu từ máy bay không người lái
  • Giải pháp kết hợp giữa hướng dẫn vật lý và AI trong các tình huống nhạy cảm về an toàn có thể kiểm soát hơn, không giống như điều khiển học hoàn toàn mơ hồ

Nhìn nhận về điều này

Kích thước Đánh giá
Tầm quan trọng Cao
Loại Nghiên cứu AI, động lực công nghệ, xu hướng ngành

Kết luận: Hướng đi này vẫn còn khá sớm. Đối tượng liên quan nhất là các đội ngũ thực hiện hoạt động trên không - nhà sản xuất robot/máy bay không người lái, phòng thí nghiệm nghiên cứu, nhà cung cấp giải pháp. Giao dịch ngắn hạn không có ý nghĩa nhiều, nhưng nhà đầu tư dài hạn có thể lưu ý các điểm then chốt từ nghiên cứu đến mở rộng quy mô.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.29KNgười nắm giữ:2
    0.09%
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.29KNgười nắm giữ:2
    0.07%
  • Vốn hóa:$2.29KNgười nắm giữ:2
    0.10%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Ghim