Robot "Không no đủ", dữ liệu thực tế vẫn là lĩnh vực tranh giành của trí tuệ thân thể

robot
Đang tạo bản tóm tắt

Vấn đề dữ liệu là một trong những thách thức cốt lõi mà ngành công nghiệp robot đang đối mặt trong quá trình nâng cấp số hóa và tự động hóa trí tuệ ngay lúc này.

Ngày 28 tháng 3, với tư cách là một diễn đàn song song của Diễn đàn Trung Quan Cố, Đại hội Khoa học viễn tưởng Trung Quốc 2026 đã chính thức được khởi động tại hiện trường, Trung tâm huấn luyện số về xúc giác thể hiện thân thể và tri giác đa phương thức của Bắc Kinh, đặt tại quận Thạch Cảnh Sơn, Bắc Kinh, đã được gắn biển chính thức.

Theo tìm hiểu của phóng viên, trung tâm này do Tập đoàn Công nghệ Đổi mới Bắc Kinh Thạch Cảnh Sơn Co., Ltd. và He Shan Technology hợp tác xây dựng, bám sát nhu cầu phát triển của ngành “trí tuệ thể hiện thân thể”, xác định ba hướng công nghệ chính là xúc giác, dị cấu trúc và thu thập dữ liệu không người tự chủ, xây dựng một nền tảng chuyển hóa công nghệ toàn quy trình tích hợp thu thập dữ liệu đa phương thức, huấn luyện thuật toán và triển khai vào kịch bản thực tế.

Vấn đề dữ liệu là một trong những thách thức cốt lõi mà ngành công nghiệp robot đang đối mặt trong quá trình nâng cấp số hóa và tự động hóa trí tuệ ngay lúc này. Trong phần “Đối thoại trí tuệ thể hiện thân thể trị giá hàng chục tỷ” của Diễn đàn Trung Quan Cố, người đồng sáng lập Xingdong Yuan là ông/ bà Xi Yue cho rằng, độ khó lớn nhất của sự phát triển trí tuệ thể hiện thân thể hiện nay vẫn là dữ liệu.

Xét từ góc độ kịch bản triển khai nghiệp vụ cụ thể, Xi Yue cho rằng, việc thu thập dữ liệu trong bối cảnh thực có độ khó cao, cần phía đơn vị kịch bản mở quyền truy cập; đồng thời việc thu thập quy mô lớn gặp các vấn đề như chi phí cao và thời gian kéo dài. Trong khi đó, các phương án thay thế hiện có lại có những giới hạn: mô hình “tự xây dựng trường huấn luyện để 1:1 tái hiện bối cảnh thực” mà ngành thường dùng, do phụ thuộc vào việc kỹ sư tham gia toàn bộ quá trình thu thập, huấn luyện, triển khai và định vị vấn đề, nên dẫn đến hiệu suất tổng thể thấp và chi phí cao.

Xi Yue cho rằng ngành có thể xây dựng “vòng khép kín bánh xe dữ liệu: thu thập dữ liệu – lặp cải tiến mô hình”, để robot có thể tự chủ xử lý các tình huống cực đoan khác nhau trong môi trường thực và liên tục nâng cao hiệu suất của hệ thống; thứ hai là thúc đẩy mô hình thu thập kết hợp “trình diễn của con người + thu thập dữ liệu bằng máy thật”, nhưng hiện vẫn cần tập trung giải quyết các khác biệt giữa hai phương thức này về cấu hình bản thể, hình thái vận động và phương thức tri giác.

Người sáng lập Nguyên Lực Linh Cơ, Đường Văn Bính, thừa nhận rằng dữ liệu là một trong những điểm nghẽn của trí tuệ thể hiện thân thể ở thời điểm hiện tại, nhưng không phải là toàn bộ vấn đề. Theo ông, bản chất của việc thu thập dữ liệu là vấn đề tiền và thời gian: bằng cách đầu tư vốn để mua robot, xây trường huấn luyện, thuê nhân viên điều khiển từ xa, thuê ngoài gắn nhãn, có thể nhanh chóng tích lũy lượng dữ liệu lên đến hàng triệu giờ và mẫu quy mô hàng trăm triệu. Vì vậy, việc “có hay không có dữ liệu” không phải là rào cản đối với ngành. Thứ thực sự tạo lợi thế cạnh tranh là liệu doanh nghiệp có thể tự động hồi lưu dữ liệu từ bối cảnh thực về hay không, và liệu có thể xây dựng vòng khép kín bánh xe dữ liệu hiệu quả hay không.

Hiện tại, Zhi Ping Square đã có nhiều cách thức để thu thập dữ liệu, nhưng quay về thực tế, người đồng sáng lập Trương Bằng vẫn cho rằng giá trị dữ liệu của bối cảnh thực là không thể thay thế; đây cũng là hướng mà ngành hiện nay buộc phải tập trung triển khai—một phần tạo ra hồi lưu dữ liệu thông qua các sản phẩm được triển khai thực tế tuyến đầu và đồng thời làm cho dữ liệu được lắng đọng lại, đó là tài sản dữ liệu quý giá nhất. Trong điều kiện đảm bảo an toàn, Zhi Ping Square cũng sẽ chia sẻ phần dữ liệu này với khách hàng.

Theo tìm hiểu của phóng viên, hiện nay giai đoạn bốn của Dự án Trung tâm thu thập và huấn luyện dữ liệu robot hình người của Bắc Kinh Thạch Cảnh Sơn chủ yếu hợp tác với các công ty như Leju, He Shan, Rayman, Lingchu,… nhằm thử giải quyết tình trạng thiếu dữ liệu và điểm nghẽn về chất lượng trong ngành robot.

Đối với vấn đề cung–cầu dữ liệu robot hiện nay, một người trong ngành cho phóng viên biết rằng, hiện lĩnh vực trí tuệ thể hiện thân thể đang trải qua quá trình tái cấu trúc hệ thống dữ liệu: các công nghệ dữ liệu không phụ thuộc bản thể (như giải pháp EGO cho dữ liệu góc nhìn người thứ nhất, và UMI cho giao diện thao tác phổ quát) đang nổi lên, khiến các nhà máy thu thập dữ liệu điều khiển từ xa vốn phụ thuộc vào đầu tư tài sản nặng có thể rơi vào tình thế khó khăn trong phát triển.

Xét theo góc độ giá trị dữ liệu, người này cho rằng: dữ liệu bối cảnh thực vẫn là phần “đỉnh tháp” của dữ liệu cần thiết cho huấn luyện mô hình robot, nhưng ngành nhìn chung phải đối mặt với hai vấn đề cốt lõi. Một là sự thiếu hụt chuẩn hóa trong chất lượng dữ liệu và thiết kế pipeline dữ liệu; hai là năng lực xử lý dữ liệu có sự chênh lệch đáng kể giữa các ngành/phía nhà cung cấp, không phải tất cả nhà sản xuất đều có năng lực kỹ thuật để xây dựng hệ thống xử lý dữ liệu hiệu quả. Đồng thời, trong ngành thiếu cơ chế chia sẻ các “bí quyết kỹ thuật dữ liệu” thống nhất và thiếu hệ thống đánh giá chuẩn mực, khiến hiệu suất ứng dụng dữ liệu không đồng đều giữa các bên.

Người này nói rằng, nếu trong tương lai các công nghệ dữ liệu không phụ thuộc bản thể như EGO, UMI có thể được phổ cập, thì có thể tiếp tục khuếch đại tính khan hiếm cốt lõi của tài nguyên kịch bản; đồng thời phía doanh nghiệp cũng có khả năng thoát khỏi sự phụ thuộc vào các nhà máy thu thập dữ liệu truyền thống, trực tiếp hoàn thành việc thu thập dữ liệu ngay trong bối cảnh thực. Mức độ tiếp cận và tính đa dạng của kịch bản sẽ trở thành biến số then chốt của năng lực cạnh tranh về dữ liệu.

Do đó, xét theo xu hướng nâng cấp và lặp cải tiến công nghệ, trí tuệ thể hiện thân thể cần dữ liệu huấn luyện quy mô hàng tỷ giờ; hiện tổng lượng vẫn còn thiếu nghiêm trọng. Tuy nhiên, một số tài sản cốt lõi bị lệch với các tuyến công nghệ chủ đạo trong tương lai có thể đối mặt với rủi ro bị mất giá: như trường hợp các trung tâm tài sản nặng phụ thuộc vào bản thể robot và địa điểm cố định dẫn đến việc suy giảm công suất có ích và chi phí đơn vị tăng vọt.

Về dài hạn, logic cạnh tranh cốt lõi trong lĩnh vực dữ liệu sẽ thay đổi căn bản: từ cuộc so tài phần cứng về việc “có hay không có trung tâm huấn luyện theo quy mô hóa”, chuyển sang các phương diện như năng lực thu được dữ liệu từ bối cảnh thực, hiệu suất lặp cải tiến của vòng khép kín giữa kịch bản và dữ liệu.

Tin tức quy mô lớn, giải đọc chính xác—tất cả có tại ứng dụng Tài chính Sina (新浪财经APP)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim