Robot làm việc nhà thực sự đã đến. Biến số Vương Tiềm: Trong 3 đến 5 năm tới, robot gia đình sẽ trở thành tiêu chuẩn trong cuộc sống.

Hỏi AI · Làm thế nào để robot tự biến đổi vượt qua giới hạn công nghệ trong các cảnh家庭场景?

Bài|Viên Tiểu Lệ

Biên tập|Lưu Bằng

Năm 2026, ngành robot ngày càng sôi động hơn.

Từ màn trình diễn võ thuật trên sân khấu Xuân Vãn đến cú nhào lộn gây chú ý toàn cầu, ngành robot liên tục bứt phá về công nghệ, nóng lên về vốn đầu tư và dư luận. Nhưng đối với các gia đình bình thường, vấn đề họ quan tâm nhất vẫn là: Khi nào mới có robot thực sự bước vào nhà, giúp đỡ làm việc nhà một cách thực chất?

Vấn đề này tưởng chừng đơn giản, nhưng thực ra rất khó trả lời. Bởi trong tất cả các cảnh có thể ứng dụng, gia đình gần như là môi trường phức tạp nhất, khó chuẩn hóa nhất, khó nhân rộng nhất trong ngành.

So với các cảnh chuẩn hóa như nhà máy, kho bãi, logistics, thì điểm khó của gia đình là gần như không có câu trả lời chuẩn mực thực sự. Các kiểu nhà khác nhau, thói quen sắp xếp khác nhau, nhịp sống khác nhau, khiến robot phải đối mặt với một môi trường mở đầy tính ngẫu nhiên và phức tạp. Nó không chỉ cần nhận diện vật thể, hiểu lệnh, mà còn phải phân biệt được những gì có thể chạm, những gì không thể, khi nào nên động, khi nào dừng, và trong môi trường có người già, trẻ nhỏ, thậm chí cả thú cưng cùng tồn tại, phải đảm bảo an toàn.

Chính vì cảnh gia đình quá phức tạp, dù các công ty robot toàn cầu đều đang cạnh tranh về trí tuệ chung và robot hình người, nhưng ít doanh nghiệp thực sự đặt “vào nhà, làm việc nhà” làm chiến trường chính.

Ở nước ngoài, Tesla Optimus hiện vẫn chủ yếu thử nghiệm trong nhà máy, ứng dụng gia đình chỉ là mục tiêu xa hơn; Figure tập trung thương mại vào sản xuất và cảnh doanh nghiệp; dù đã nhắm vào cảnh gia đình, dòng NE0 của 1X dù nhấn mạnh môi trường an toàn, hỗ trợ gia đình, cũng dự định thử nghiệm sớm trong nhà, nhưng vẫn còn trong giai đoạn thử nghiệm nguyên mẫu, còn xa mới đạt được dịch vụ ổn định thực sự.

Trong nước cũng tương tự, dù là các dự án hướng tới chăm sóc gia đình như Zhiyuan Lingxi X2, hay khám phá hệ sinh thái gia đình thông minh liên kết Haier, đều mới dừng lại ở trình diễn, huấn luyện, điều chỉnh liên kết, chuẩn bị sản xuất hàng loạt hoặc thử nghiệm nhỏ.

Nói cách khác, hiện tại, những robot gấp quần áo, lau bàn mà mọi người thấy chỉ là trong video trình diễn, còn robot thực sự vào nhà, ổn định làm việc nhà trong quy trình dịch vụ thực tế vẫn còn là khoảng trống.

Chính vì thế, dù ngành robot nóng lên chưa từng có, nhưng trước đây, trên toàn cầu, hầu như chưa có doanh nghiệp nào thực sự bước vào nhà, tham gia làm việc nhà thực tế.

Và giờ, khoảng trống đó lần đầu tiên đã được lấp đầy.

Tháng 3 năm nay, robot dọn dẹp nhà đầu tiên của Trung Quốc, cũng là robot dọn dẹp nhà thực sự đầu tiên trên thế giới bước vào nhà, chính thức đi vào hoạt động tại Thâm Quyến. Người dùng chỉ cần đặt lịch qua ứng dụng 58 Tongcheng, là có thể trải nghiệm dịch vụ dọn dẹp nhà cửa kết hợp giữa nhân viên vệ sinh và robot thông minh có thân thể.

Điều này có nghĩa, việc robot có thân thể làm việc nhà đã bắt đầu từ việc trình diễn video, xác nhận ý tưởng, chuyển sang thực tế gia đình, dịch vụ thực.

“Robot dọn dẹp này là robot đầu tiên trên thế giới thực sự bước vào nhà, giúp con người làm việc nhà một cách thực chất,” sáng lập viên tự biến đổi robot Vương Tiềm nói với Tencent Finance. Theo ông, “Đây cũng là lần đầu tiên trong lịch sử nhân loại. Công nghệ thân thể thông minh lần đầu rời khỏi phòng thí nghiệm, thực sự bước vào cảnh dịch vụ dân sinh.”

01 Robot dọn dẹp, chính thức bước vào dịch vụ gia đình

Theo video công bố, “robot dọn dẹp” này không chỉ quét dọn mặt sàn, còn có thể sắp xếp đồ đạc, lau bàn ăn, dọn dẹp sofa, giường ngủ, và hoàn thành các công việc như đóng gói rác mang đi, thậm chí hỗ trợ chăm sóc thú cưng. Nó không chỉ là thiết bị làm sạch đơn điểm, cũng không phải công cụ tự động hóa cố định, mà đã được tích hợp vào quy trình dọn dẹp nhà hoàn chỉnh, bắt đầu đảm nhận một phần công việc nhà thực sự.

Hiện tại, dịch vụ này sử dụng mô hình “nhân viên vệ sinh + robot” hợp tác, chứ không phải robot làm việc độc lập. Theo Vương Tiềm, đây không phải là sự thỏa hiệp, mà là cách thực tế hơn trong giai đoạn này. “Chúng tôi không nghĩ về việc con người sẽ bị thay thế, mà là thiếu nhân lực,” ông nói. So với việc để robot tự vận hành, mô hình hợp tác giữa người và máy dễ được thị trường chấp nhận hơn, phù hợp hơn với nhịp độ dịch vụ gia đình. Quan trọng hơn, mô hình này giúp robot nhanh chóng vào nhà thực, qua từng lần dịch vụ, thu thập các vấn đề nhỏ, tích lũy dữ liệu chất lượng cao, liên tục cải tiến.

“Thật sự là một bước ngoặt lớn, trước đây chúng tôi không thể dự đoán robot vào nhà thực sẽ gặp phải những tình huống nào,” Vương Tiềm thừa nhận, “Hiện tại, robot dịch vụ gia đình còn rất non trẻ, chính vì chưa trưởng thành, nên cần để nó vào nhà thực để mài giũa, rèn luyện, thu thập vấn đề, tích lũy dữ liệu, từng bước trưởng thành.”

Với ngành công nghiệp robot, điều nguy hiểm nhất không phải là khả năng chưa hoàn thiện, mà là mãi dừng lại trong phòng thí nghiệm, không thể vào đời thực.

02 Tại sao là tự biến đổi

Khi các ông lớn robot toàn cầu đều đẩy mạnh trong cảnh công nghiệp, tại sao một công ty khởi nghiệp Trung Quốc mới thành lập hơn 2 năm lại có thể vượt qua cảnh gia đình trước tiên? Trước hết, là do họ đã chọn chiến lược từ đầu.

Công ty này thành lập tháng 12 năm 2023, là một trong số ít doanh nghiệp Trung Quốc đầu tiên phát triển mô hình lớn chung thân thiện toàn diện dựa trên mô hình lớn thân thể thông minh, tập trung vào mô hình lớn chung của thế giới vật lý và robot dịch vụ gia đình. Từ khi thành lập, họ đã huy động hơn 20 tỷ nhân dân tệ, gần đây hoàn thành vòng gọi vốn 1 tỷ A++, có sự góp mặt của ByteDance, Sequoia China, Shenchuang Capital và các tổ chức lớn khác.

Quan trọng hơn, tự biến đổi từ đầu đã đặt cược vào cảnh gia đình, và vào “não bộ” của robot, chứ không chỉ phần cứng có thể vận động.

“Nếu chúng ta làm tốt cảnh gia đình, về lý thuyết có thể phù hợp tất cả các cảnh khác,” Vương Tiềm dùng logic của mô hình ngôn ngữ lớn để so sánh: không phải là từng chút một trở nên thông minh hơn, mà là bùng nổ khả năng chung, rồi dần dần ứng dụng vào các cảnh khác. “Khi robot học cách xử lý nhiều nhiệm vụ khác nhau, nó sẽ học được những điểm chung của các nhiệm vụ đó — logic, cách suy nghĩ, định luật vật lý. Và cảnh gia đình, chính là nơi chứa nhiều nhiệm vụ đa dạng, phức tạp nhất. Để robot học trong môi trường phức tạp nhất, nó sẽ tự nhiên học được những năng lực cốt lõi nhất, và trở nên thông minh hơn.”

Logic đằng sau đó là, nếu robot có thể làm việc ổn định trong cảnh gia đình, nơi có nhiều vấn đề, nhiệm vụ phức tạp, con người và môi trường khó kiểm soát nhất, thì khả năng của nó, về lý thuyết, cũng dễ dàng chuyển sang các cảnh khác như chăm sóc người già, quản lý tòa nhà, dịch vụ ăn uống.

Và điều quyết định thành công hay không chính là “não bộ” của robot, chứ không phải là “thân thể”.

Vương Tiềm cho rằng, điểm đau chính của ngành thân thể thông minh hiện nay rất rõ ràng: phần cứng ngày càng trưởng thành, nhưng trí tuệ của não bộ robot vẫn còn xa mới đáp ứng được nhu cầu thị trường và mong đợi của cộng đồng. Nhìn bề ngoài, việc robot bắt chước cầm cốc, lau bàn, sắp xếp đồ đạc chỉ là vấn đề của cánh tay cơ khí và đôi tay linh hoạt, nhưng thực tế, đằng sau đó là sự phối hợp cao độ của cảm biến thị giác, hiểu ngôn ngữ, phân tích nhiệm vụ, sinh ra hành động, phản hồi môi trường và điều chỉnh theo thời gian.

Chính vì vậy, tự biến đổi đặt trọng tâm công nghệ vào mô hình đa mô thức gốc của trí tuệ thân thể.

Các mô hình VLA thông thường, thường chỉ coi hành động là đầu ra duy nhất. Tự biến đổi xây dựng một kiến trúc thực sự toàn diện Omni, tức “đa mô thức gốc”. Đột phá của họ nằm ở chỗ, từ thiết kế nền tảng, đã tích hợp đa mô thức, thực hiện “đa mô thức vào, đa mô thức ra” thực sự.

“Đa mô thức vào” nghĩa là mô hình có thể nhận trực tiếp và đồng thời nhiều dạng dữ liệu như hình ảnh, lệnh ngôn ngữ, cảm biến thân thể; còn “đa mô thức ra” không chỉ đơn thuần xuất ra lệnh hành động vật lý như các mô hình VLA thông thường, mà còn dự đoán đồng thời các dạng như hành động, ngôn ngữ, hình ảnh.

Với robot gia đình, điểm khó chưa bao giờ là cánh tay có thể nâng lên hay không, mà là nó có thể hiểu rõ một phòng khách lộn xộn, nghe rõ một lệnh mơ hồ, rồi trước khi hành động, dự đoán kết quả vật lý có thể xảy ra. Dựa trên mô hình Omni gốc, robot không chỉ phản ứng theo hình ảnh hiện tại, còn có khả năng “tưởng tượng” và “dự đoán” như con người — trước khi bắt tay làm, nó đã dự đoán được cảnh vật tiếp theo (nếu đưa tay lấy vật này, đồ đạc xung quanh có thể bị đổ), đồng thời sinh ra ngôn ngữ tương tác, và xuất ra hành động vật lý chính xác.

Xét theo tiến trình ngành, học tập end-to-end đã trở thành xu hướng chung, như Figure AI, 1X, tự biến đổi đều chọn hướng này, nhưng điểm khác biệt của tự biến đổi là kết hợp sâu giữa VLA và World Model, và đưa khả năng này vào thử nghiệm trong cảnh dịch vụ gia đình thực tế, chứ không chỉ dừng lại ở trình diễn trong phòng thí nghiệm.

03, Ngoài gia đình, chăm sóc người già là cảnh tiềm năng nhất

Hiện tại, robot dọn dẹp nhà chỉ mới bắt đầu thử nghiệm giới hạn tại Thâm Quyến, mục tiêu chính của nhóm là hoàn thiện sản phẩm, thu thập phản hồi từ cảnh gia đình thực, huấn luyện mô hình “não bộ” robot, tối ưu hóa hiệu suất. Vương Tiềm tiết lộ, trong thời gian tới sẽ đẩy mạnh mở rộng ra toàn quốc, dù còn cần thời gian để phổ cập, nhưng ông tin rằng trong 3-5 năm tới, robot gia đình có thể trở thành thiết bị phổ biến, trở thành tiêu chuẩn trong cuộc sống của mọi người.

Nói về tương lai, ngoài dọn dẹp nhà, Vương Tiềm còn rất kỳ vọng vào khả năng ứng dụng của trí tuệ thân thể trong lĩnh vực chăm sóc người già. “Chăm sóc người già là cảnh cực kỳ giá trị và có nhiều khe hở,” ông nói. Dù là chăm sóc tại nhà hay tại trung tâm, dù đã có nhân viên phục vụ, nhưng chất lượng dịch vụ vẫn chưa đạt kỳ vọng. Vương Tiềm nhận định, “Robot sẽ trở thành công nghệ then chốt để duy trì phát triển bền vững lâu dài của ngành chăm sóc người già, và đó cũng là xu thế tất yếu trong tương lai.”

Ngoài ra, các cảnh dịch vụ đời sống như ăn uống, quản lý tòa nhà, đều có thể là các ứng dụng tiềm năng của robot.

Nhìn lại hành trình khởi nghiệp, Vương Tiềm thừa nhận, thời điểm khó khăn nhất không phải là đột phá công nghệ, mà là sự thiếu chấp nhận của xã hội đối với lĩnh vực “robot đa năng gia đình”. Nhưng ông luôn kiên định với con đường “trước tiên là trí tuệ chung”, và chính sự kiên trì này đã giúp tự biến đổi đi đến ngày hôm nay.

Về robot dọn dẹp này và toàn ngành, Vương Tiềm đầy kỳ vọng: “Hôm nay chính là khởi đầu của một kỷ nguyên mới. Với sự liên tục đổi mới công nghệ, trí tuệ thân thể cuối cùng sẽ thay đổi toàn diện cảnh dịch vụ sống, để công nghệ thông minh thực sự mang lại lợi ích cho từng gia đình.”

Với toàn ngành, ý nghĩa của robot dọn dẹp này có thể không nằm ở việc nó có hoàn hảo hôm nay hay không, mà ở lần đầu tiên robot thực sự với tư cách người phục vụ, bước vào nhà của người bình thường, bắt đầu đảm nhận một phần công việc thực tế.

Những năm qua, ngành robot không thiếu các màn trình diễn, nhưng thiếu những bước chân vào cuộc sống.

Và giờ, điều đó đã bắt đầu xảy ra.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim