Ngành công nghiệp Bots có những bước đột phá đáng kể: AI và công nghệ mã hóa dẫn dắt kỷ nguyên tự động hóa mới
Sự phát triển nhanh chóng của trí tuệ nhân tạo đang định hình lại kỳ vọng của con người đối với Bots. Khi các mô hình ngôn ngữ lớn bắt đầu tương tác với thế giới bên ngoài, nhiều người cho rằng các tác nhân AI đã đạt đến đỉnh cao. Tuy nhiên, nếu nhìn lại các tác phẩm khoa học viễn tưởng cổ điển, chúng ta sẽ nhận ra rằng điều mà con người thật sự mong muốn là những Bots có thể tương tác trong thế giới vật lý.
Các chuyên gia trong ngành tin rằng lĩnh vực Bots sắp trải qua một bước đột phá lớn tương tự như ChatGPT. Bài viết này sẽ đầu tiên phân tích cách mà công nghệ AI đã thay đổi cấu trúc ngành trong những năm gần đây, sau đó sẽ thảo luận về cách các tiến bộ công nghệ như pin, độ trễ và thu thập dữ liệu sẽ định hình tương lai, cũng như vai trò của mã hóa trong đó. Cuối cùng, chúng tôi sẽ tập trung vào các lĩnh vực quan trọng như an toàn của Bots, tài trợ, đánh giá và giáo dục.
1. Yếu tố then chốt của sự thay đổi
(1) đột phá của trí tuệ nhân tạo
Sự tiến bộ của mô hình ngôn ngữ đa mô hình đã cung cấp "bộ não" cần thiết cho Bots thực hiện các nhiệm vụ phức tạp. Bots chủ yếu cảm nhận môi trường thông qua thị giác và thính giác.
Các mô hình thị giác máy tính truyền thống rất giỏi trong việc phát hiện và phân loại đối tượng, nhưng khó khăn trong việc chuyển đổi thông tin thị giác thành các chỉ thị hành động có mục đích. Mặc dù các mô hình ngôn ngữ lớn thể hiện xuất sắc trong việc hiểu và sinh văn bản, nhưng khả năng nhận thức thế giới vật lý của chúng còn hạn chế.
Thông qua mô hình thị giác-ngôn ngữ-hành động ( VLA ), Bots có thể tích hợp nhận thức thị giác, hiểu ngôn ngữ và hành động thực thể trong một khung tính toán thống nhất. Vào tháng 2 năm 2025, một công ty AI đã ra mắt mô hình điều khiển Bots hình người tổng quát Helix, mô hình VLA này đã thiết lập tiêu chuẩn mới cho ngành với khả năng tổng quát không có mẫu và kiến trúc hai hệ thống. Đặc tính tổng quát không có mẫu cho phép Bots thích ứng với cảnh mới, đối tượng mới và lệnh mới mà không cần huấn luyện lại cho mỗi nhiệm vụ. Kiến trúc hai hệ thống tách biệt suy luận cao cấp và suy luận nhẹ, đạt được sự kết hợp giữa tư duy giống con người và độ chính xác thời gian thực cho Bots hình người thương mại.
(2) Robot kinh tế trở thành hiện thực
Công nghệ thay đổi thế giới đều có một đặc điểm chung - khả năng phổ biến. Điện thoại thông minh, máy tính cá nhân, công nghệ in 3D đã được phổ biến với mức giá mà tầng lớp trung lưu có thể chấp nhận. Khi giá của một số Bots thấp hơn một chiếc xe hơi hạng trung hoặc thu nhập tối thiểu hàng năm ở Mỹ, hình ảnh một thế giới mà công việc chân tay và các công việc hàng ngày chủ yếu do Bots đảm nhận không còn là điều không thể với tới.
(3) Từ kho bãi đến thị trường tiêu dùng
Công nghệ Bots đang mở rộng từ các giải pháp kho hàng sang lĩnh vực tiêu dùng. Thế giới của chúng ta được thiết kế cho con người - con người có thể hoàn thành tất cả các công việc mà Bots chuyên nghiệp làm được, trong khi Bots chuyên nghiệp không thể đảm nhận tất cả các công việc của con người. Các công ty Bots không còn giới hạn trong việc sản xuất Bots dành riêng cho nhà máy, mà chuyển sang phát triển các Bots hình người đa năng hơn. Do đó, công nghệ Bots không chỉ tồn tại trong kho hàng, mà còn thâm nhập vào cuộc sống hàng ngày.
Chi phí là một trong những nút thắt chính của khả năng mở rộng. Chỉ số quan trọng nhất là chi phí tổng hợp mỗi giờ, được tính bằng: tổng chi phí cơ hội thời gian cho việc đào tạo và sạc, chi phí thực hiện nhiệm vụ và chi phí mua Bots, chia cho tổng thời gian hoạt động của Bots. Chi phí này phải thấp hơn mức lương trung bình của ngành liên quan để có tính cạnh tranh.
Để thâm nhập toàn diện vào lĩnh vực kho bãi, chi phí tổng hợp của Bots mỗi giờ phải dưới 31,39 đô la. Trong thị trường tiêu dùng lớn nhất - lĩnh vực giáo dục tư nhân và dịch vụ sức khỏe, chi phí này cần được kiểm soát dưới 35,18 đô la. Hiện tại, Bots đang phát triển theo hướng rẻ hơn, hiệu quả hơn và đa năng hơn.
2. Bước đột phá tiếp theo của công nghệ Bots
(1) tối ưu hóa pin
Công nghệ pin luôn là điểm nghẽn đối với robot thân thiện với người dùng. Các loại xe điện sớm do hạn chế về công nghệ pin dẫn đến thời gian sử dụng ngắn, chi phí cao và tính thực tiễn thấp nên khó phổ biến, robot cũng đang đối mặt với tình huống tương tự. Một số robot nổi tiếng chỉ có thể hoạt động từ 90 phút đến 2 giờ cho mỗi lần sạc. Rõ ràng, người dùng không muốn phải sạc thủ công sau mỗi hai giờ, do đó, việc tự động sạc và kết nối với hạ tầng trở thành hướng phát triển chính. Hiện tại, có hai chế độ sạc chính cho robot: thay pin hoặc sạc trực tiếp.
Chế độ thay pin thực hiện công việc liên tục thông qua việc thay thế nhanh chóng các bộ pin đã cạn kiệt, giảm thiểu thời gian ngừng hoạt động, phù hợp với các tình huống ngoài trời hoặc trong nhà máy. Quy trình này có thể được vận hành bằng tay hoặc hoàn thành tự động.
Sạc cảm ứng sử dụng phương pháp cung cấp điện không dây, mặc dù việc sạc đầy mất nhiều thời gian, nhưng có thể dễ dàng thực hiện quy trình tự động hoàn toàn.
(2) tối ưu hóa độ trễ
Hoạt động độ trễ thấp có thể được chia thành hai loại: nhận thức môi trường và điều khiển từ xa. Nhận thức đề cập đến khả năng nhận thức không gian của Bots đối với môi trường, trong khi điều khiển từ xa đề cập đến việc kiểm soát thời gian thực của người điều khiển.
Nghiên cứu cho thấy, hệ thống cảm nhận của Bots bắt đầu từ cảm biến giá rẻ, nhưng lợi thế công nghệ nằm ở phần mềm tích hợp, tính toán tiêu thụ điện năng thấp và mạch điều khiển chính xác trong mili giây. Khi Bots hoàn thành việc xác định vị trí không gian, mạng nơ-ron nhẹ sẽ đánh dấu các yếu tố như vật cản, pallet hoặc con người. Khi nhãn cảnh nhập vào hệ thống lập kế hoạch, nó sẽ ngay lập tức tạo ra các lệnh động cơ gửi đến chân, cụm bánh xe hoặc cánh tay cơ khí. Độ trễ cảm nhận dưới 50 mili giây tương đương với tốc độ phản xạ của con người - bất kỳ độ trễ nào vượt quá ngưỡng này sẽ dẫn đến hành động vụng về của Bots. Do đó, 90% quyết định cần được thực hiện tại chỗ thông qua một mạng lưới hình ảnh-ngôn ngữ-hành động đơn lẻ.
Robot tự động hoàn toàn cần đảm bảo mô hình VLA hiệu suất cao có độ trễ dưới 50 mili giây; robot điều khiển từ xa thì yêu cầu độ trễ tín hiệu giữa đầu điều khiển và robot không vượt quá 50 mili giây. Tầm quan trọng của mô hình VLA ở đây đặc biệt nổi bật - nếu đầu vào hình ảnh và văn bản được xử lý bởi các mô hình khác nhau rồi mới đưa vào mô hình ngôn ngữ lớn, độ trễ tổng thể sẽ vượt quá ngưỡng 50 mili giây.
(3) Tối ưu hóa thu thập dữ liệu
Việc thu thập dữ liệu chủ yếu có ba phương thức: dữ liệu video thế giới thực, dữ liệu tổng hợp và dữ liệu điều khiển từ xa. Điểm nghẽn cốt lõi giữa dữ liệu thực và dữ liệu tổng hợp là thu hẹp sự khác biệt giữa hành vi vật lý của Bots và mô hình video/simulations. Dữ liệu video thực thiếu phản hồi lực, sai số chuyển động khớp và các chi tiết vật lý như biến dạng vật liệu; dữ liệu mô phỏng thì thiếu các biến số không thể đoán trước như sự cố cảm biến, hệ số ma sát.
Cách thu thập dữ liệu tiềm năng nhất là điều khiển từ xa - do các nhà điều hành con người điều khiển Bots thực hiện nhiệm vụ. Nhưng chi phí nhân công là yếu tố hạn chế chính trong việc thu thập dữ liệu bằng điều khiển từ xa.
Phát triển phần cứng tùy chỉnh cũng đang cung cấp giải pháp mới cho việc thu thập dữ liệu chất lượng cao. Một số công ty kết hợp các phương pháp chính thống với phần cứng tùy chỉnh để thu thập dữ liệu chuyển động con người đa chiều, sau khi xử lý, dữ liệu này được chuyển đổi thành các tập dữ liệu phù hợp cho việc đào tạo mạng nơ-ron của Bots, kết hợp với chu kỳ lặp nhanh để cung cấp dữ liệu chất lượng cao khổng lồ cho việc đào tạo AI Bots. Những quy trình công nghệ này cùng nhau rút ngắn con đường chuyển đổi từ dữ liệu thô đến Bots có thể triển khai.
3. Lĩnh vực khám phá trọng điểm
(1) mã hóa công nghệ và Bots融合
Mã hóa có thể khuyến khích các bên không tin cậy nâng cao hiệu quả mạng Bots. Dựa trên các lĩnh vực chính đã đề cập trước đó, mã hóa có thể nâng cao hiệu quả trong ba khía cạnh: tích hợp cơ sở hạ tầng, tối ưu hóa độ trễ và thu thập dữ liệu.
Mạng lưới cơ sở hạ tầng vật lý phi tập trung ( DePIN ) được kỳ vọng sẽ cách mạng hóa cơ sở hạ tầng sạc. Khi những con robot hình người hoạt động toàn cầu như ô tô, các trạm sạc cần phải dễ tiếp cận như các trạm xăng. Mạng lưới tập trung cần đầu tư lớn ban đầu, trong khi DePIN sẽ phân chia chi phí cho các nhà điều hành nút, giúp cơ sở hạ tầng sạc mở rộng nhanh chóng đến nhiều khu vực hơn.
DePIN còn có thể tận dụng cơ sở hạ tầng phân phối để tối ưu hóa độ trễ điều khiển từ xa. Bằng cách tổng hợp tài nguyên tính toán từ các nút cạnh phân tán về mặt địa lý, các chỉ thị điều khiển từ xa có thể được xử lý bởi các nút địa phương hoặc nút gần nhất có sẵn, tối đa hóa việc rút ngắn khoảng cách truyền dữ liệu, đáng kể giảm độ trễ giao tiếp. Tuy nhiên, hiện tại các dự án DePIN chủ yếu tập trung vào lưu trữ phi tập trung, phân phối nội dung và chia sẻ băng thông, mặc dù có các dự án trình bày lợi thế ứng dụng của tính toán biên trong phát trực tuyến hoặc Internet vạn vật, vẫn chưa được mở rộng sang lĩnh vực Bots hoặc điều khiển từ xa.
Điều khiển từ xa là phương pháp thu thập dữ liệu đầy triển vọng nhất, nhưng chi phí thuê nhân viên chuyên nghiệp để thu thập dữ liệu từ các thực thể tập trung rất cao. DePIN giải quyết vấn đề này bằng cách khuyến khích các bên thứ ba cung cấp dữ liệu điều khiển từ xa thông qua mã hóa. Một số dự án đang xây dựng mạng lưới người điều khiển từ xa toàn cầu, chuyển đổi đóng góp của họ thành tài sản kỹ thuật số được mã hóa, tạo thành hệ thống phi tập trung không cần giấy phép—các người tham gia vừa có thể thu lợi nhuận, vừa tham gia vào quản trị và hỗ trợ đào tạo Bots AGI.
(2) An toàn luôn là mối quan tâm cốt lõi
Mục tiêu cuối cùng của công nghệ Bots là đạt được sự tự trị hoàn toàn, nhưng điều mà con người không muốn thấy là sự tự trị biến Bots thành vũ khí tấn công. Vấn đề an toàn của các mô hình ngôn ngữ lớn đã thu hút sự chú ý, và khi những mô hình này có khả năng hành động thực thể, an toàn của Bots trở thành điều kiện tiên quyết quan trọng để xã hội chấp nhận.
An ninh kinh tế là một trong những trụ cột của sự phát triển hệ sinh thái Bots. Một số công ty trong lĩnh vực này đang xây dựng lớp phối hợp máy móc phi tập trung, thông qua mã hóa để xác thực danh tính thiết bị, xác minh sự tồn tại vật lý và truy cập tài nguyên. Khác với việc quản lý thị trường nhiệm vụ đơn giản, những hệ thống này cho phép Bots tự chứng minh thông tin danh tính, vị trí địa lý và hồ sơ hành vi mà không cần phụ thuộc vào trung gian tập trung.
Hành vi ràng buộc và xác thực danh tính được thực hiện thông qua cơ chế trên chuỗi, đảm bảo rằng bất kỳ ai cũng có thể kiểm toán tính tuân thủ. Những Bots đáp ứng tiêu chuẩn an toàn, yêu cầu chất lượng và quy định khu vực sẽ nhận được phần thưởng, trong khi những người vi phạm sẽ phải đối mặt với hình phạt hoặc bị loại bỏ, từ đó thiết lập cơ chế trách nhiệm và niềm tin trong mạng lưới máy móc tự chủ.
Mạng tái thế chấp bên thứ ba cũng có thể cung cấp bảo đảm an ninh tương đương. Mặc dù hệ thống tham số hình phạt vẫn cần được hoàn thiện, công nghệ liên quan đã bước vào giai đoạn thực tiễn. Dự kiến các tiêu chuẩn an ninh ngành sẽ sớm hình thành, khi đó các tham số hình phạt sẽ được mô hình hóa theo các tiêu chuẩn này.
4. Bù đắp khoảng trống trong công nghệ robot
Khác với AI, lĩnh vực Bots khó có thể bắt đầu khi nguồn vốn hạn chế. Để thực hiện sự phổ biến của Bots, ngưỡng phát triển của chúng cần được hạ xuống mức độ thuận tiện tương tự như phát triển ứng dụng AI. Chúng tôi cho rằng có không gian cải thiện ở ba cấp độ: cơ chế tài chính, hệ thống đánh giá và hệ sinh thái giáo dục.
Vốn là nỗi đau trong lĩnh vực Robots. Việc phát triển chương trình máy tính chỉ cần một máy tính và tài nguyên điện toán đám mây, trong khi việc xây dựng một Robot hoàn chỉnh phải mua sắm động cơ, cảm biến, pin và các phần cứng khác, chi phí dễ dàng vượt qua 100.000 đô la. Tính chất phần cứng này khiến việc phát triển Robot so với AI thiếu linh hoạt và chi phí cao.
Cơ sở hạ tầng đánh giá Bots trong các tình huống thực tế vẫn đang trong giai đoạn sơ khai. Lĩnh vực AI đã thiết lập một hệ thống hàm mất mát rõ ràng, việc kiểm tra có thể hoàn toàn ảo hóa. Tuy nhiên, các chiến lược ảo xuất sắc không thể trực tiếp chuyển đổi thành các giải pháp hiệu quả trong thế giới thực. Bots cần có cơ sở hạ tầng đánh giá chiến lược tự chủ để thử nghiệm trong các môi trường thực tế đa dạng, nhằm đạt được tối ưu hóa lặp.
Khi cơ sở hạ tầng này trở nên trưởng thành, nhân tài sẽ ồ ạt đổ về, và robot hình người sẽ tái hiện đường cong bùng nổ của Web2. Một số công ty đang tiến về hướng này - dự án mã nguồn mở của họ biến phần cứng nguyên bản thành những thực thể thông minh có khả năng nâng cấp và nhận thức kinh tế. Các mô-đun lập kế hoạch thị giác, ngôn ngữ và chuyển động có thể được cắm và sử dụng như ứng dụng điện thoại, tất cả các bước suy luận đều được trình bày bằng tiếng Anh rõ ràng, giúp các điều hành viên không cần phải tiếp xúc với firmware mà vẫn có thể kiểm tra hoặc điều chỉnh hành vi. Khả năng suy luận ngôn ngữ tự nhiên này cho phép thế hệ nhân tài mới tham gia một cách liền mạch vào lĩnh vực robot, đánh dấu một bước quan trọng cho nền tảng mở nhằm bùng nổ cuộc cách mạng robot, giống như tác động tăng tốc của phong trào mã nguồn mở đối với AI.
Mật độ nhân tài quyết định quỹ đạo ngành. Hệ thống giáo dục phổ cập có cấu trúc là rất quan trọng cho việc cung cấp nhân tài trong lĩnh vực Bots. Một số công ty đã bắt đầu triển khai chương trình giáo dục phổ thông dựa trên Bots hình người tại các trường công lập K-12 ở Mỹ. Chương trình này được thiết kế để không phụ thuộc vào nền tảng, có thể thích ứng với nhiều hình thức Bots khác nhau, cung cấp cơ hội thực hành cho học sinh. Tín hiệu tích cực này củng cố những đánh giá trong ngành: Trong vài năm tới, mức độ phong phú của tài nguyên giáo dục Bots sẽ tương đương với lĩnh vực AI.
5. Triển vọng tương lai
Mô hình hành động ngôn ngữ hình ảnh (VLA) với những đổi mới và hiệu ứng kinh tế quy mô đã sinh ra những robot hình người tiết kiệm chi phí, hiệu quả và phổ biến. Khi robot kho bãi mở rộng ra thị trường tiêu dùng, tính an toàn, mô hình tài chính và hệ thống đánh giá trở thành những hướng khám phá chính. Các chuyên gia trong ngành tin tưởng rằng công nghệ mã hóa sẽ thông qua ba
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
12 thích
Phần thưởng
12
4
Đăng lại
Chia sẻ
Bình luận
0/400
WalletDetective
· 08-08 19:09
Cảm thấy bối rối, lại có chuyện gì xảy ra nữa?
Xem bản gốcTrả lời0
ChainSpy
· 08-08 17:18
Cái ai này vẫn chưa làm việc nghiêm túc, ngày nào cũng khoe khoang.
Xem bản gốcTrả lời0
StablecoinArbitrageur
· 08-08 17:13
*thở dài* thêm một chu kỳ cường điệu công nghệ nữa... hiển thị cho tôi các biên lợi nhuận trên robot arbitrage trước đã, thật lòng mà nói.
Xem bản gốcTrả lời0
DaoDeveloper
· 08-08 17:01
thú vị làm sao zk-proofs có thể bảo mật tương tác giữa robot và con người thật lòng
AI và công nghệ mã hóa dẫn dắt cuộc cách mạng trong ngành Bots, mô hình VLA mở ra kỷ nguyên tự động hóa mới
Ngành công nghiệp Bots có những bước đột phá đáng kể: AI và công nghệ mã hóa dẫn dắt kỷ nguyên tự động hóa mới
Sự phát triển nhanh chóng của trí tuệ nhân tạo đang định hình lại kỳ vọng của con người đối với Bots. Khi các mô hình ngôn ngữ lớn bắt đầu tương tác với thế giới bên ngoài, nhiều người cho rằng các tác nhân AI đã đạt đến đỉnh cao. Tuy nhiên, nếu nhìn lại các tác phẩm khoa học viễn tưởng cổ điển, chúng ta sẽ nhận ra rằng điều mà con người thật sự mong muốn là những Bots có thể tương tác trong thế giới vật lý.
Các chuyên gia trong ngành tin rằng lĩnh vực Bots sắp trải qua một bước đột phá lớn tương tự như ChatGPT. Bài viết này sẽ đầu tiên phân tích cách mà công nghệ AI đã thay đổi cấu trúc ngành trong những năm gần đây, sau đó sẽ thảo luận về cách các tiến bộ công nghệ như pin, độ trễ và thu thập dữ liệu sẽ định hình tương lai, cũng như vai trò của mã hóa trong đó. Cuối cùng, chúng tôi sẽ tập trung vào các lĩnh vực quan trọng như an toàn của Bots, tài trợ, đánh giá và giáo dục.
1. Yếu tố then chốt của sự thay đổi
(1) đột phá của trí tuệ nhân tạo
Sự tiến bộ của mô hình ngôn ngữ đa mô hình đã cung cấp "bộ não" cần thiết cho Bots thực hiện các nhiệm vụ phức tạp. Bots chủ yếu cảm nhận môi trường thông qua thị giác và thính giác.
Các mô hình thị giác máy tính truyền thống rất giỏi trong việc phát hiện và phân loại đối tượng, nhưng khó khăn trong việc chuyển đổi thông tin thị giác thành các chỉ thị hành động có mục đích. Mặc dù các mô hình ngôn ngữ lớn thể hiện xuất sắc trong việc hiểu và sinh văn bản, nhưng khả năng nhận thức thế giới vật lý của chúng còn hạn chế.
Thông qua mô hình thị giác-ngôn ngữ-hành động ( VLA ), Bots có thể tích hợp nhận thức thị giác, hiểu ngôn ngữ và hành động thực thể trong một khung tính toán thống nhất. Vào tháng 2 năm 2025, một công ty AI đã ra mắt mô hình điều khiển Bots hình người tổng quát Helix, mô hình VLA này đã thiết lập tiêu chuẩn mới cho ngành với khả năng tổng quát không có mẫu và kiến trúc hai hệ thống. Đặc tính tổng quát không có mẫu cho phép Bots thích ứng với cảnh mới, đối tượng mới và lệnh mới mà không cần huấn luyện lại cho mỗi nhiệm vụ. Kiến trúc hai hệ thống tách biệt suy luận cao cấp và suy luận nhẹ, đạt được sự kết hợp giữa tư duy giống con người và độ chính xác thời gian thực cho Bots hình người thương mại.
(2) Robot kinh tế trở thành hiện thực
Công nghệ thay đổi thế giới đều có một đặc điểm chung - khả năng phổ biến. Điện thoại thông minh, máy tính cá nhân, công nghệ in 3D đã được phổ biến với mức giá mà tầng lớp trung lưu có thể chấp nhận. Khi giá của một số Bots thấp hơn một chiếc xe hơi hạng trung hoặc thu nhập tối thiểu hàng năm ở Mỹ, hình ảnh một thế giới mà công việc chân tay và các công việc hàng ngày chủ yếu do Bots đảm nhận không còn là điều không thể với tới.
(3) Từ kho bãi đến thị trường tiêu dùng
Công nghệ Bots đang mở rộng từ các giải pháp kho hàng sang lĩnh vực tiêu dùng. Thế giới của chúng ta được thiết kế cho con người - con người có thể hoàn thành tất cả các công việc mà Bots chuyên nghiệp làm được, trong khi Bots chuyên nghiệp không thể đảm nhận tất cả các công việc của con người. Các công ty Bots không còn giới hạn trong việc sản xuất Bots dành riêng cho nhà máy, mà chuyển sang phát triển các Bots hình người đa năng hơn. Do đó, công nghệ Bots không chỉ tồn tại trong kho hàng, mà còn thâm nhập vào cuộc sống hàng ngày.
Chi phí là một trong những nút thắt chính của khả năng mở rộng. Chỉ số quan trọng nhất là chi phí tổng hợp mỗi giờ, được tính bằng: tổng chi phí cơ hội thời gian cho việc đào tạo và sạc, chi phí thực hiện nhiệm vụ và chi phí mua Bots, chia cho tổng thời gian hoạt động của Bots. Chi phí này phải thấp hơn mức lương trung bình của ngành liên quan để có tính cạnh tranh.
Để thâm nhập toàn diện vào lĩnh vực kho bãi, chi phí tổng hợp của Bots mỗi giờ phải dưới 31,39 đô la. Trong thị trường tiêu dùng lớn nhất - lĩnh vực giáo dục tư nhân và dịch vụ sức khỏe, chi phí này cần được kiểm soát dưới 35,18 đô la. Hiện tại, Bots đang phát triển theo hướng rẻ hơn, hiệu quả hơn và đa năng hơn.
2. Bước đột phá tiếp theo của công nghệ Bots
(1) tối ưu hóa pin
Công nghệ pin luôn là điểm nghẽn đối với robot thân thiện với người dùng. Các loại xe điện sớm do hạn chế về công nghệ pin dẫn đến thời gian sử dụng ngắn, chi phí cao và tính thực tiễn thấp nên khó phổ biến, robot cũng đang đối mặt với tình huống tương tự. Một số robot nổi tiếng chỉ có thể hoạt động từ 90 phút đến 2 giờ cho mỗi lần sạc. Rõ ràng, người dùng không muốn phải sạc thủ công sau mỗi hai giờ, do đó, việc tự động sạc và kết nối với hạ tầng trở thành hướng phát triển chính. Hiện tại, có hai chế độ sạc chính cho robot: thay pin hoặc sạc trực tiếp.
Chế độ thay pin thực hiện công việc liên tục thông qua việc thay thế nhanh chóng các bộ pin đã cạn kiệt, giảm thiểu thời gian ngừng hoạt động, phù hợp với các tình huống ngoài trời hoặc trong nhà máy. Quy trình này có thể được vận hành bằng tay hoặc hoàn thành tự động.
Sạc cảm ứng sử dụng phương pháp cung cấp điện không dây, mặc dù việc sạc đầy mất nhiều thời gian, nhưng có thể dễ dàng thực hiện quy trình tự động hoàn toàn.
(2) tối ưu hóa độ trễ
Hoạt động độ trễ thấp có thể được chia thành hai loại: nhận thức môi trường và điều khiển từ xa. Nhận thức đề cập đến khả năng nhận thức không gian của Bots đối với môi trường, trong khi điều khiển từ xa đề cập đến việc kiểm soát thời gian thực của người điều khiển.
Nghiên cứu cho thấy, hệ thống cảm nhận của Bots bắt đầu từ cảm biến giá rẻ, nhưng lợi thế công nghệ nằm ở phần mềm tích hợp, tính toán tiêu thụ điện năng thấp và mạch điều khiển chính xác trong mili giây. Khi Bots hoàn thành việc xác định vị trí không gian, mạng nơ-ron nhẹ sẽ đánh dấu các yếu tố như vật cản, pallet hoặc con người. Khi nhãn cảnh nhập vào hệ thống lập kế hoạch, nó sẽ ngay lập tức tạo ra các lệnh động cơ gửi đến chân, cụm bánh xe hoặc cánh tay cơ khí. Độ trễ cảm nhận dưới 50 mili giây tương đương với tốc độ phản xạ của con người - bất kỳ độ trễ nào vượt quá ngưỡng này sẽ dẫn đến hành động vụng về của Bots. Do đó, 90% quyết định cần được thực hiện tại chỗ thông qua một mạng lưới hình ảnh-ngôn ngữ-hành động đơn lẻ.
Robot tự động hoàn toàn cần đảm bảo mô hình VLA hiệu suất cao có độ trễ dưới 50 mili giây; robot điều khiển từ xa thì yêu cầu độ trễ tín hiệu giữa đầu điều khiển và robot không vượt quá 50 mili giây. Tầm quan trọng của mô hình VLA ở đây đặc biệt nổi bật - nếu đầu vào hình ảnh và văn bản được xử lý bởi các mô hình khác nhau rồi mới đưa vào mô hình ngôn ngữ lớn, độ trễ tổng thể sẽ vượt quá ngưỡng 50 mili giây.
(3) Tối ưu hóa thu thập dữ liệu
Việc thu thập dữ liệu chủ yếu có ba phương thức: dữ liệu video thế giới thực, dữ liệu tổng hợp và dữ liệu điều khiển từ xa. Điểm nghẽn cốt lõi giữa dữ liệu thực và dữ liệu tổng hợp là thu hẹp sự khác biệt giữa hành vi vật lý của Bots và mô hình video/simulations. Dữ liệu video thực thiếu phản hồi lực, sai số chuyển động khớp và các chi tiết vật lý như biến dạng vật liệu; dữ liệu mô phỏng thì thiếu các biến số không thể đoán trước như sự cố cảm biến, hệ số ma sát.
Cách thu thập dữ liệu tiềm năng nhất là điều khiển từ xa - do các nhà điều hành con người điều khiển Bots thực hiện nhiệm vụ. Nhưng chi phí nhân công là yếu tố hạn chế chính trong việc thu thập dữ liệu bằng điều khiển từ xa.
Phát triển phần cứng tùy chỉnh cũng đang cung cấp giải pháp mới cho việc thu thập dữ liệu chất lượng cao. Một số công ty kết hợp các phương pháp chính thống với phần cứng tùy chỉnh để thu thập dữ liệu chuyển động con người đa chiều, sau khi xử lý, dữ liệu này được chuyển đổi thành các tập dữ liệu phù hợp cho việc đào tạo mạng nơ-ron của Bots, kết hợp với chu kỳ lặp nhanh để cung cấp dữ liệu chất lượng cao khổng lồ cho việc đào tạo AI Bots. Những quy trình công nghệ này cùng nhau rút ngắn con đường chuyển đổi từ dữ liệu thô đến Bots có thể triển khai.
3. Lĩnh vực khám phá trọng điểm
(1) mã hóa công nghệ và Bots融合
Mã hóa có thể khuyến khích các bên không tin cậy nâng cao hiệu quả mạng Bots. Dựa trên các lĩnh vực chính đã đề cập trước đó, mã hóa có thể nâng cao hiệu quả trong ba khía cạnh: tích hợp cơ sở hạ tầng, tối ưu hóa độ trễ và thu thập dữ liệu.
Mạng lưới cơ sở hạ tầng vật lý phi tập trung ( DePIN ) được kỳ vọng sẽ cách mạng hóa cơ sở hạ tầng sạc. Khi những con robot hình người hoạt động toàn cầu như ô tô, các trạm sạc cần phải dễ tiếp cận như các trạm xăng. Mạng lưới tập trung cần đầu tư lớn ban đầu, trong khi DePIN sẽ phân chia chi phí cho các nhà điều hành nút, giúp cơ sở hạ tầng sạc mở rộng nhanh chóng đến nhiều khu vực hơn.
DePIN còn có thể tận dụng cơ sở hạ tầng phân phối để tối ưu hóa độ trễ điều khiển từ xa. Bằng cách tổng hợp tài nguyên tính toán từ các nút cạnh phân tán về mặt địa lý, các chỉ thị điều khiển từ xa có thể được xử lý bởi các nút địa phương hoặc nút gần nhất có sẵn, tối đa hóa việc rút ngắn khoảng cách truyền dữ liệu, đáng kể giảm độ trễ giao tiếp. Tuy nhiên, hiện tại các dự án DePIN chủ yếu tập trung vào lưu trữ phi tập trung, phân phối nội dung và chia sẻ băng thông, mặc dù có các dự án trình bày lợi thế ứng dụng của tính toán biên trong phát trực tuyến hoặc Internet vạn vật, vẫn chưa được mở rộng sang lĩnh vực Bots hoặc điều khiển từ xa.
Điều khiển từ xa là phương pháp thu thập dữ liệu đầy triển vọng nhất, nhưng chi phí thuê nhân viên chuyên nghiệp để thu thập dữ liệu từ các thực thể tập trung rất cao. DePIN giải quyết vấn đề này bằng cách khuyến khích các bên thứ ba cung cấp dữ liệu điều khiển từ xa thông qua mã hóa. Một số dự án đang xây dựng mạng lưới người điều khiển từ xa toàn cầu, chuyển đổi đóng góp của họ thành tài sản kỹ thuật số được mã hóa, tạo thành hệ thống phi tập trung không cần giấy phép—các người tham gia vừa có thể thu lợi nhuận, vừa tham gia vào quản trị và hỗ trợ đào tạo Bots AGI.
(2) An toàn luôn là mối quan tâm cốt lõi
Mục tiêu cuối cùng của công nghệ Bots là đạt được sự tự trị hoàn toàn, nhưng điều mà con người không muốn thấy là sự tự trị biến Bots thành vũ khí tấn công. Vấn đề an toàn của các mô hình ngôn ngữ lớn đã thu hút sự chú ý, và khi những mô hình này có khả năng hành động thực thể, an toàn của Bots trở thành điều kiện tiên quyết quan trọng để xã hội chấp nhận.
An ninh kinh tế là một trong những trụ cột của sự phát triển hệ sinh thái Bots. Một số công ty trong lĩnh vực này đang xây dựng lớp phối hợp máy móc phi tập trung, thông qua mã hóa để xác thực danh tính thiết bị, xác minh sự tồn tại vật lý và truy cập tài nguyên. Khác với việc quản lý thị trường nhiệm vụ đơn giản, những hệ thống này cho phép Bots tự chứng minh thông tin danh tính, vị trí địa lý và hồ sơ hành vi mà không cần phụ thuộc vào trung gian tập trung.
Hành vi ràng buộc và xác thực danh tính được thực hiện thông qua cơ chế trên chuỗi, đảm bảo rằng bất kỳ ai cũng có thể kiểm toán tính tuân thủ. Những Bots đáp ứng tiêu chuẩn an toàn, yêu cầu chất lượng và quy định khu vực sẽ nhận được phần thưởng, trong khi những người vi phạm sẽ phải đối mặt với hình phạt hoặc bị loại bỏ, từ đó thiết lập cơ chế trách nhiệm và niềm tin trong mạng lưới máy móc tự chủ.
Mạng tái thế chấp bên thứ ba cũng có thể cung cấp bảo đảm an ninh tương đương. Mặc dù hệ thống tham số hình phạt vẫn cần được hoàn thiện, công nghệ liên quan đã bước vào giai đoạn thực tiễn. Dự kiến các tiêu chuẩn an ninh ngành sẽ sớm hình thành, khi đó các tham số hình phạt sẽ được mô hình hóa theo các tiêu chuẩn này.
4. Bù đắp khoảng trống trong công nghệ robot
Khác với AI, lĩnh vực Bots khó có thể bắt đầu khi nguồn vốn hạn chế. Để thực hiện sự phổ biến của Bots, ngưỡng phát triển của chúng cần được hạ xuống mức độ thuận tiện tương tự như phát triển ứng dụng AI. Chúng tôi cho rằng có không gian cải thiện ở ba cấp độ: cơ chế tài chính, hệ thống đánh giá và hệ sinh thái giáo dục.
Vốn là nỗi đau trong lĩnh vực Robots. Việc phát triển chương trình máy tính chỉ cần một máy tính và tài nguyên điện toán đám mây, trong khi việc xây dựng một Robot hoàn chỉnh phải mua sắm động cơ, cảm biến, pin và các phần cứng khác, chi phí dễ dàng vượt qua 100.000 đô la. Tính chất phần cứng này khiến việc phát triển Robot so với AI thiếu linh hoạt và chi phí cao.
Cơ sở hạ tầng đánh giá Bots trong các tình huống thực tế vẫn đang trong giai đoạn sơ khai. Lĩnh vực AI đã thiết lập một hệ thống hàm mất mát rõ ràng, việc kiểm tra có thể hoàn toàn ảo hóa. Tuy nhiên, các chiến lược ảo xuất sắc không thể trực tiếp chuyển đổi thành các giải pháp hiệu quả trong thế giới thực. Bots cần có cơ sở hạ tầng đánh giá chiến lược tự chủ để thử nghiệm trong các môi trường thực tế đa dạng, nhằm đạt được tối ưu hóa lặp.
Khi cơ sở hạ tầng này trở nên trưởng thành, nhân tài sẽ ồ ạt đổ về, và robot hình người sẽ tái hiện đường cong bùng nổ của Web2. Một số công ty đang tiến về hướng này - dự án mã nguồn mở của họ biến phần cứng nguyên bản thành những thực thể thông minh có khả năng nâng cấp và nhận thức kinh tế. Các mô-đun lập kế hoạch thị giác, ngôn ngữ và chuyển động có thể được cắm và sử dụng như ứng dụng điện thoại, tất cả các bước suy luận đều được trình bày bằng tiếng Anh rõ ràng, giúp các điều hành viên không cần phải tiếp xúc với firmware mà vẫn có thể kiểm tra hoặc điều chỉnh hành vi. Khả năng suy luận ngôn ngữ tự nhiên này cho phép thế hệ nhân tài mới tham gia một cách liền mạch vào lĩnh vực robot, đánh dấu một bước quan trọng cho nền tảng mở nhằm bùng nổ cuộc cách mạng robot, giống như tác động tăng tốc của phong trào mã nguồn mở đối với AI.
Mật độ nhân tài quyết định quỹ đạo ngành. Hệ thống giáo dục phổ cập có cấu trúc là rất quan trọng cho việc cung cấp nhân tài trong lĩnh vực Bots. Một số công ty đã bắt đầu triển khai chương trình giáo dục phổ thông dựa trên Bots hình người tại các trường công lập K-12 ở Mỹ. Chương trình này được thiết kế để không phụ thuộc vào nền tảng, có thể thích ứng với nhiều hình thức Bots khác nhau, cung cấp cơ hội thực hành cho học sinh. Tín hiệu tích cực này củng cố những đánh giá trong ngành: Trong vài năm tới, mức độ phong phú của tài nguyên giáo dục Bots sẽ tương đương với lĩnh vực AI.
5. Triển vọng tương lai
Mô hình hành động ngôn ngữ hình ảnh (VLA) với những đổi mới và hiệu ứng kinh tế quy mô đã sinh ra những robot hình người tiết kiệm chi phí, hiệu quả và phổ biến. Khi robot kho bãi mở rộng ra thị trường tiêu dùng, tính an toàn, mô hình tài chính và hệ thống đánh giá trở thành những hướng khám phá chính. Các chuyên gia trong ngành tin tưởng rằng công nghệ mã hóa sẽ thông qua ba