Trí Nguyên lần này đã vượt mặt Elon Musk

SnapshotLaborer · 2026-03-30T11:03:56+00:00

Những điều Elon Musk chưa làm được, thì Peng Zhihui và robot Zhiyuan của ông đã làm được. Không lâu trước đây, Tesla xác nhận rằng sản phẩm robot hình người Optimus Gen3 của họ sẽ bắt đầu thử nghiệm quy mô nhỏ vào mùa hè năm nay, và dự kiến sẽ sản xuất hàng loạt vào năm 2027. Mặc dù tiến trình này đã nhiều lần bị hoãn, nhưng tầm nhìn của Musk vẫn là tiêu chuẩn tham khảo toàn cầu trong ngành. Tuy nhiên, sự thay đổi nhanh chóng đã đến bất ngờ, kế hoạch phát triển theo “năm” ban đầu đã bị rút ngắn còn “tháng”. Ngày 30 tháng 3, robot Zhiyuan tuyên bố rằng nhà máy sản xuất hàng loạt đã xuất xưởng hơn 10.000 robot hình người. Khoảng cách giữa lần tổ chức lễ bàn giao 5.000 chiếc trước đó chưa đầy ba tháng. Việc Zhiyuan “vượt mốc 10.000” đồng nghĩa với việc trí tuệ thể hiện của Trung Quốc từ phòng thí nghiệm đã bước vào giai đoạn quy mô thương mại. Đối với công ty Trung Quốc này, thành lập chưa đầy ba năm, việc sản xuất hàng loạt trong lĩnh vực này

SnapshotLaborer

2026-03-30 11:03:56

马斯克都没做到的事，彭志辉和他的智元机器人做到了。

不久前，特斯拉确认旗下人形机器人产品Optimus Gen3将在今年夏天启动小批量试产，2027年才有望大规模量产。尽管这个节奏已经历经多次跳票，但马斯克的愿景依然是全球行业的参考系。

但转折很快不期而至，本来要按“年”来规划的爬产进度，被压缩到了“月”的单位。

3月30日，智元机器人宣告量产基地走出的人形机器人突破了一万台。这距离他们上一次举办五千台下线仪式，过去了不到三个月。

智元的“破万”意味着国内具身智能从实验室，踏进了规模商业化的节点。

对于这家成立不到三年的中国玩家来说，在量产这件事上赢过行业巨擘，这本身就是一种宣言。

突破量产之壁

如果把过去两年国内人形机器人的发展画一条曲线，2023—2024 是“Demo 曲线”，2025 年开始进入“工程现实曲线”。

两条曲线的分野在于，前者依靠算法、动作库、场景编排和渲染就能造出“效果”；后者只接受一个标准：连续无故障运行。

“在很多人眼里，量产制造好像就是流水线、开模、注塑、组装等一系列标准化的流程。但实际对人形机器人产品品类来说，规模化本身就是最难的技术问题之一。”

3月30日，在会后的访谈中，智元联合创始人、总裁兼CTO彭志辉向华尔街见闻指出，机器人行业规模量产远比想象中困难的多。

他作了一个对比，消费电子出了故障大不了重启；但机器人一旦失误，“任何一点微小的品质故障都会在实际运行过程中被无限放大，可能会造成人员受伤、环境破坏后果严重”。

这件事的难度，在智元内部 2024 年的量产阶段体现得很彻底。

智元高级副总裁兼通用业务部总裁王闯向华尔街见闻回忆，在那一年里，智元正处于从第1台艰难爬坡到第200台的阶段，这是公司的“至暗时刻”。

当年 8 月新品发布会后，智元一口气发布五款机器人，其中最火的远征 A2，单台售价超 50 万元。发布会后，订单如雪片般飞来，但智元却完全接不住——产品无法量产，技术无法落地，商业模式完全走不通。

王闯说，当时生产线几乎没有标准化可言，做出来的机器越多，团队能用于干活的时间反而越少，因为大量时间都被消耗在维修上，每台下线的机器人甚至都不一样，工程师必须逐一调参。

那是一段用人力填补工业化鸿沟的苦日子。到了2024年年底，为了解决第一批量产带来的海量问题，智元先后有150多人次的研发人员驻扎在工厂一线。

每一个量级的跨越，解决的都是完全不同维度的问题。接下来，从200台到1000台，最大的瓶颈从产线转移到了供应链。

彭志辉向华尔街见闻透露，智元最早决定做人形机器人的时候，去行业里调研了一圈，“发现并没有能够适配我们、批量交付、成熟可靠的核心部件供应商”。

智元内部员工称，早期的供应商凑一凑交个一两百台的货或许还能应付，但当订单规模达到千台甚至万台时，原有的体系和质量标准便瞬间崩溃，产品根本经不起大批量的返工折腾。传统关节、减速器、灵巧手、电池没有任何一家供应商能满足千台级的交付稳定性，更不要说一致性。

既然没有现成的路，智元只能选择自己修路。彭志辉说，“我们是和供应链一起成长，把他们拉进来做联合研发”。从材料工艺到工装夹具，从测试台架到老化流程，全部重新定义。

智元在关节、灵巧手等核心零部件上采用了与供应商联合研发的新工艺，让部件更轻、更准、寿命更长、成本更低。他们还构建了"半小时供应圈"，要求核心供应商必须在半小时之内能响应。

这种深度绑定的供应链策略，在短期内看起来很重，但长期来看，恰恰构成了智元的护城河。

工程复利的开端

如果说供应链能力决定了智元能不能造出一万台机器人，那数据飞轮的复利，则决定了这一万台机器人造出来之后能产生多大的价值。

"以前做机器人的思路是先造一个本体，先把身体造出来，有一个硬件，再往里面开发塞一些’大脑’、模型、算法。但现在随着一万台机器人下线，身体和大脑开始同步进化。"彭志辉如是说道。

如今，每一台下线的机器人都会被部署汽车制造产线、3C电子车间、商业服务空间持续收集数据。

这些真实数据反过来又会以前所未有的速度训练智元的基座模型，使得模型变得更加泛化、更加实用，从而推动机器人解锁更多的复杂场景。

"机器人会越用越聪明。"彭志辉说，“一万台是让我们飞轮彻底转起来的关键节点。”

事实上，这个逻辑和智驾行业的演进路径高度一致。斯拉的FSD12之所以能在2025年前后实现质的飞跃，核心原因就是数百万辆在路上行驶的车辆持续贡献真实驾驶数据。眼下，智元正在人形机器人领域复刻同样的路径。

在王闯看来，任何一项颠覆性技术在早期发展时，都会让人觉得步履维艰、无比缓慢，但当它真正跨过某个奇点，像海啸一般席卷而来时，所有人都会惊呼它的速度太快了。

就像曾经的电动汽车和智能驾驶一样，人形机器人也正在逼近这个爆发的临界点。

根据IDC的数据，2025年全球人形机器人出货量接近1.8万台，同比增长约508%。其中，中国企业在全球出货量中占据了主导地位，超过美国同行。

2026年，行业进入规模量产攻坚期。集邦咨询预测全球出货量将突破5万台，同比再增超过700%。智元在开年不到三个月就完成了万台下线，按照这个节奏，王闯在发布会上给出了预测：“十万台可能是在2027年年底。”

这个预测建立在两个前提之上，首先是全自主的技术部署态，让机器人脱离人的操控，理解环境、自主充电、持续适应更复杂的任务；二是全球化，王闯说，“机器人品类需求全球都是通用的，老龄化、少子化、劳动力不足以及枯燥重复的岗位越来越招不到人，这是全球面临的问题”。

从2023年8月问世的远征A1，到2026年3月第一万台远征A3走下产线，智元用不到三年的时间完成了一个几乎不可能的跨越。

这家公司的故事，本质上是中国制造业系统能力在一个全新品类上的又一次集中释放，同样的剧本已经上演过很多次，但每一次依然令人震动。

一万台不是终点。但从这一天开始，人形机器人不再只是想象中的未来概念，而是当下的产品。

_ 以下是华尔街见闻·全天候科技与智元联合创始人兼CTO彭志辉、高级副总裁兼通用业务部总裁王闯的对话实录：_

全天候科技：在万台量产的背后，智元在供应链、成本控制、产能上做了哪些关键布局？

**彭志辉：**Vừa rồi cũng vừa đề cập độ khó của việc đạt tới 10.000 chiếc: quá trình từ 1.000 lên 10.000 mất hơn một năm, hoàn thành bước nhảy quy mô gấp 10 lần. Thách thức nằm ở việc thể hiện năng lực tổng hợp ở năm chiều: hiệu suất sản xuất, triển khai theo kịch bản, giá trị cho khách hàng, dữ liệu vòng quay (data flywheel), và sự phát triển cùng nhau của chuỗi cung ứng. Có thể nói, ZhiYuan là công ty trí tuệ nhân tạo toàn cầu đầu tiên thực sự chạy trọn quy trình từ mẫu thử trong phòng thí nghiệm đến bàn giao quy mô lớn công nghiệp. Khó khăn lớn nhất là thách thức về tính nhất quán theo lô (batch consistency) và kiểm soát chi phí.

Robot không giống điện thoại. Nếu có vấn đề, thì phần mềm lỗi có thể khởi động lại, còn phần cứng cũng không bị tổn hại gì nhiều. Nhưng robot mà mắc lỗi thì hễ ở bất cứ khâu nào “đứt nhịp”, thì chất lượng sản phẩm sẽ sụp đổ, đồng thời cũng gây tổn hại không thể đảo ngược cho người dùng và môi trường. Nguồn cung ổn định của các linh kiện cốt lõi, giảm chi phí toàn máy, chất lượng, độ ổn định, độ tin cậy đều là những “xương cứng”.

Để giải quyết các vấn đề này, có hai việc tương đối quan trọng:

Thứ nhất, “đâm đầu” vào chuỗi cung ứng. Cùng chuỗi cung ứng trưởng thành, định nghĩa lại tiêu chuẩn của ngành mới. Chúng tôi đã xây dựng hệ thống chuỗi cung ứng chuẩn hóa đầu tiên toàn cầu cho trí tuệ thân thể (具身智能) và thậm chí kéo các đối tác cốt lõi vào để cùng nghiên cứu phát triển (joint R&D). Ví dụ, ở các linh kiện cốt lõi như khớp nối và bàn tay khéo (灵巧手) chúng tôi áp dụng quy trình/công nghệ mới; những quy trình này được nghiên cứu phát triển cùng với nhà cung cấp, giúp linh kiện nhẹ hơn, chính xác hơn, tuổi thọ dài hơn, chi phí thấp hơn, và từ đó thể hiện lợi thế sản phẩm rất rõ.

Thứ hai, tái cấu trúc mô hình sản xuất. Bao gồm việc khu vực nơi chúng tôi đang ở đã làm nhà máy “tiền thử nghiệm” (pilot) để xác minh quy trình; nhà máy sản xuất quy mô lớn đảm bảo ổn định. Nhà máy pilot là nơi xác minh sớm các quy trình như công nghệ và lắp ráp. Ngoài ra, thông qua sản xuất linh hoạt như “sản xuất theo đơn hàng”, chúng tôi không chỉ đạt được khả năng tự chủ kiểm soát đối với các linh kiện cốt lõi, mà còn xây dựng “vòng cung ứng trong nửa giờ” (半个小时供应圈). Chúng tôi đề xuất các yêu cầu với nhà cung cấp: nhà cung cấp phải có khả năng phản hồi trong vòng nửa giờ.

10.000 chiếc không phải điểm kết thúc, mà là để chứng minh rằng chúng tôi có năng lực dùng tính xác định của kỹ thuật (engineering) để đưa trí tuệ thân thể thực sự từ “đồ chơi” thành “lực lượng sản xuất trong tương lai” — và đây chính là một nút then chốt không thể thiếu.

全天候科技：Thời điểm ChatGPT của trí tuệ thân thể đã đến chưa?

**王闯：**Sự khác biệt lớn nhất là khách hàng thường xuyên phản hồi rằng dây chuyền sản xuất hay thay đổi. Ví dụ, dây chuyền nạp/xả (上下料) pin (电芯) có thể trong một thời gian lại được chuyển thành dây chuyền cho các loại pin khác nhau, thậm chí là loại vật liệu nạp/xả hoàn toàn khác. Nếu dùng phương pháp tự động hóa truyền thống, thường sẽ phải loại bỏ các thiết bị đã làm trước đó, rồi phát triển thiết bị mới; ít nhất là để kỹ sư lại onsite một tháng để phát triển thuật toán mới.

Ý nghĩa lớn nhất của trí tuệ thân thể nằm ở tính “khả năng khái quát” (generalization). Giống như việc hiện tại chúng tôi dùng GPT để hỏi bất kỳ câu hỏi nào: có rất nhiều câu trả lời mơ hồ. Bạn hỏi rất mơ hồ nhưng nó vẫn có thể hiểu theo hướng khái quát. Chúng tôi muốn trong thế giới vật lý của trí tuệ thân thể, nó cũng có thể hiểu khái quát “nó cần làm gì”. Điều này có thể cần huấn luyện trước quy mô rất lớn, cộng thêm huấn luyện tăng cường dựa trên dữ liệu thu thập tại từng trạm (工位), cuối cùng để tỷ lệ thành công đạt mức mà dây chuyền chấp nhận. Dây chuyền thường có chuẩn là 99?, 9999?; nhịp (节拍) còn phải đối chuẩn với con người.

Hiện tại chúng tôi đã thấy trong một số tình huống nạp/xả, việc chạy thông (tạo ra) đã dần đi vào quỹ đạo. Chúng tôi hy vọng tương lai bánh xe (轮式) ở nhiều kịch bản hơn trong nhà máy cũng có thể chạy thông, và robot hai chân (song túc) trong các kịch bản như tiếp tân, dẫn tour, giới thiệu mua hàng cũng dần chạy thông.

全天候科技：Gần đây ZhiYuan liên tục đạt các đột phá mới về thuật toán, mô phỏng… Những robot đạt mốc 10.000 chiếc đầu tiên có được trang bị những thành quả công nghệ này không? Dữ liệu thực tế và phản hồi kỹ thuật do quy mô 10.000 tạo ra sẽ phản hồi như thế nào cho việc lặp lại (iteration) công nghệ và khả năng thích ứng kịch bản với bản thân robot ngoài đời?

**彭志辉：**Vòng khép dữ liệu (data closed loop)/data flywheel có giá trị và ý nghĩa rất lớn với chúng tôi. 10.000 chiếc lượng sản hạ tuyến đầu tiên là mẫu viễn chinh A3 (远征A3), là mẫu mới nhất ra mắt. Hiện vẫn chưa tới giai đoạn xuất hàng hàng loạt; nhiều chức năng phần mềm cũng chưa đạt đến giai đoạn hoàn thiện, và vẫn đang tiếp tục tối ưu liên tục.

Rất nhiều công nghệ mới chắc chắn sẽ được ưu tiên áp dụng và xác minh trên sản phẩm mới trước. Ví dụ A3 có những nâng cấp đáng kể về việc làm nhẹ (lightweight) cho phần thân (本体), thời lượng pin, tỷ lệ đẩy/trọng lượng (推重比), và năng lực tương tác. Toàn máy chỉ nặng 55kg, còn nhẹ hơn phần lớn con người ở cùng cỡ; thời lượng pin đạt hơn 10 giờ, và còn gắn nhiều loại cảm biến mới (ví dụ cảm biến chạm).

Quan trọng hơn nữa là phần mềm “não nhỏ & não lớn” (大小脑) và các mô hình thuật toán — tích hợp mô hình điều khiển vận hành toàn thân (全身运控) mới nhất, bao gồm cả thuật toán kiểm soát nhóm (group control) và các thành quả thuật toán có thể điều khiển theo nhóm.

Hiện tại, ngoài các mẫu mới như viễn chinh, những sản phẩm đã công bố trước đó cũng đã được triển khai vào các tình huống thực tế. Ví dụ “tinh linh” (精灵) — đã được triển khai trong các tình huống như sản xuất công nghiệp, logistics, an ninh. Chẳng hạn, ở dây chuyền máy tính bảng của Longqi Technology (龙旗科技), có A2 của chúng tôi hoạt động liên tục 24 giờ để làm công việc nạp/xả màn hình (屏幕的上下料).

G2 cũng đang ở các nhà máy điện tử như ở JianSheng (均胜): có thể lắp ráp các đồ gá yêu cầu độ khó cao với tốc độ hơn con người chỉ trong hơn 12 giây, và tỷ lệ thành công gần như đạt 100%. Bản chất của các kịch bản này là yêu cầu độ chính xác và độ ổn định của robot cực cao, mà tự động hóa truyền thống không giải quyết được. Chính những kịch bản như vậy rất có thể thể hiện giá trị của trí tuệ thân thể: không phải để thay con người, mà để giúp robot có khả năng khái quát hóa qua “một lần huấn luyện, nhiều lần triển khai”, bổ sung vị trí công việc cho con người.

“Data flywheel” cũng là “đại lợi” lớn nhất trong quá trình này. Làm việc liên tục trong môi trường thực tế sẽ giúp chúng tôi thu thập đủ dữ liệu; dữ liệu có thể giúp chúng tôi phá vỡ giới hạn năng lực tối đa trong tương lai của trí tuệ thân thể. Robot mới hạ tuyến đang đi theo con đường “xuất xưởng là tiến hóa” (出厂即进化), dựa vào dữ liệu mô phỏng và dữ liệu robot ngoài đời. Hiện nay đã có data flywheel khép vòng với dữ liệu thực tế, tạo nền tảng rất tốt để robot trong tương lai thực sự bước vào các kịch bản tạo ra giá trị của quy mô sản xuất lớn.

全天候科技：Hiện 10.000 robot này sẽ được phân bố trong những lĩnh vực nào, và những kịch bản cụ thể nào đã chạy thông ROI?

**王闯：**Hiện tại chúng tôi có 8 kịch bản thương mại chính: người dùng nghiên cứu, thu thập dữ liệu, biểu diễn giải trí/văn nghệ; đa phần là giai đoạn phát triển (开发态). Trong giai đoạn triển khai (部署态) thì có các việc như thuyết minh/đón tiếp trong cửa, kịch bản nạp/xả trong nhà máy. Tương lai chúng tôi sẽ khám phá thêm nhiều kịch bản hơn. Ví dụ như một sự tiếp tân thực sự phía trước (trước sảnh), có thể mang tính tương tác, có thể làm công việc. Ngoài ra, trong nhà máy, sau khi một trạm (工位) làm xong một việc, có thể nhanh chóng chuyển sang làm việc ở trạm khác — giống như một “con người” làm việc.

全天候科技：Hiện ngành đang ở trạng thái trăm hoa đua nở. Dù là hình thái, thuật toán hay ứng dụng kịch bản… Nếu ZhiYuan muốn trở thành “kỳ lân độc quyền cuối cùng” (终局的独角兽), rào cản quan trọng nhất là gì? Có sự đồng thuận nào được đúc kết trong cả ngành trí tuệ thân thể không?

**彭志辉：**Chúng tôi vẫn luôn đi thuyết trình bên ngoài. Rào cản cốt lõi của chúng tôi chính là chiến lược full-stack “một thân thể, ba trí tuệ” (一体三智) mà chúng tôi kiên trì. Trước đây mỗi lần ra mắt sản phẩm, chúng tôi cũng luôn nhấn mạnh: tại sao chúng tôi lại phải làm bố cục công nghệ “toàn diện và full-stack” (大而全全栈), chứ không chuyên sâu vào một mảng.

Bởi vì chúng tôi lấy ứng dụng cuối làm điểm xuất phát (以终为始), nhắm vào kịch bản ứng dụng cuối cùng. Muốn chạy thông các kịch bản thực tế, chỉ một điểm công nghệ là không thể “đánh xuyên” được. Bạn cần robot có năng lực tương tác mạnh, như một giao diện tương tác người–máy rất tốt; đồng thời nó phải thật sự làm việc được; lại cần năng lực vận động đủ mạnh, khác với robot công nghiệp cố định truyền thống.

Vì vậy cần đồng thời: trí tuệ vận động, trí tuệ tương tác, và trí tuệ tác nghiệp (作业智能). Cùng lúc đó, phần thân (本体) phải đủ chín muồi, đáng tin cậy, ổn định, chi phí thấp. Đây là một dự án kỹ thuật theo hệ thống. Vì vậy tại sao chúng tôi luôn kiên trì lộ trình công nghệ full-stack “một thân thể, ba trí tuệ”, tích hợp sâu phần thân của robot, trí tuệ vận động, trí tuệ tương tác và trí tuệ tác nghiệp.

Chúng tôi cũng tích lũy một lượng lớn Knowhow ở tầng AI mô hình nền (AI底层大模型) và ứng dụng cho các ngành dọc. Những Knowhow này cũng là một trong những “lợi thế phòng thủ” (护城河). Vừa rồi cũng đã nhắc việc xây dựng hệ sinh thái chuỗi cung ứng chuẩn hóa đầu tiên toàn cầu — đó cũng là một “lợi thế phòng thủ” rất mạnh.

全天候科技：Hiện robot đang ở giai đoạn tiến hóa từ “giống người” (拟人) sang “giống người” ở mức hơn (类人). Trong năm qua, “bộ não” của robot đã có những tiến hóa nào? Trong việc cân bằng tải trọng của bàn tay khéo (灵巧手) và lực điều khiển toàn thân (全身力控), còn cách xa đến lý tưởng “thể sinh mệnh số” (数字生命实体) bao xa?

**彭志辉：**Đó là một bức tranh tưởng tượng cho tương lai.

Trước hết, tiến hóa của “bộ não” robot là trục chính. Tại sao trong vài năm nay robot hình người lại nóng đến vậy? Không phải vì phần thân có bước đột phá công nghệ lõi (black tech) nào vượt bậc, mà vì sự phát triển của AI và sự phát triển của các mô hình lớn (large model). Chỉ từ năm 2023 khi ChatGPT xuất hiện, sự tiến hóa của “bộ não” mới là trục chính. Trong suốt hơn một năm qua, biến đổi về mặt thời gian này rất nhanh. Ở giai đoạn đầu, phần não chủ yếu dùng các công nghệ kiểu ACT, Policy để giải bài toán tạo chuỗi, nhưng bản chất vẫn nghiêng về dự đoán động tác.

Hiện nay, xu hướng chủ đạo trong giới học thuật và công nghiệp đã chuyển toàn diện sang VLA — công nghệ VLA dựa trên mô hình lớn. Điều này không chỉ là đổi kiến trúc mô hình; mà là bắt đầu thực sự thử kế tục cái gọi là Scaling law thần kỳ của mô hình ngôn ngữ lớn: gom quy mô, gom dữ liệu, gom năng lực tính toán, với hy vọng trí tuệ tổng quát của robot sẽ bộc lộ. Đây là một sự thay đổi về đại mô hình (paradigm) lớn.

Đồng thời, công nghệ cũng tiếp tục tiến hóa và lặp lại. Ví dụ, mô hình thế giới (world model) trong tương lai sẽ đóng vai trò rất quan trọng, cho phép robot thực hiện suy diễn phản thực (反事实推演) như con người. Khi con người làm một việc, sẽ trước hết suy diễn trong đầu các hệ quả do động tác tiếp theo mang lại, rồi mới điều chỉnh chiến lược một cách động. Không chỉ nhìn thấy cái gì rồi làm cái đó. Đó chính là bước nhảy căn bản từ cảm nhận tới phản ứng, từ nhận thức tới lập kế hoạch. Tất nhiên còn cần sự lặp lại và tiến hóa liên tục của công nghệ.

Hiện tại, ngay cả các linh kiện cốt lõi cũng còn có nút thắt. Ví dụ phần cứng bàn tay khéo hiện vẫn là một nút thắt lớn, đặc biệt nếu chúng ta cần tự do độ cao (high freedom), tải trọng cao (high load), và năng lực cảm nhận mạnh. Ví dụ, xúc giác làm rất tốt, nhưng đồng thời phải cực kỳ chi phí thấp. Những điểm này mâu thuẫn rất lớn với nhau trong kỹ thuật. Hiện tại toàn bộ giải pháp phần cứng vẫn chưa hội tụ. Chúng tôi đang thử nhiều lộ trình công nghệ khác nhau, các thiết kế cấu trúc mới, các lựa chọn cảm biến mới, cố gắng tìm ra sự cân bằng tương đối hoàn hảo giữa hiệu năng và chi phí.

Vừa rồi đã nhắc tới “một thân thể, ba trí tuệ”: ở mỗi lĩnh vực, mô hình nền thuật toán cũng còn cần được lặp lại ở một mức độ nhất định.

Cuối cùng, lý tưởng “thể sinh mệnh số” mà chúng tôi tưởng tượng còn cách xa bao nhiêu? Quan điểm của tôi là sẽ nhanh hơn so với tưởng tượng của một số người, nhưng vẫn cần thêm thời gian: bất kể là “thân thể” hay “linh hồn”. “Thân thể” vừa rồi tôi nói đến vẫn còn khoảng trống cần đột phá đối với phần cứng; trong quá trình cân bằng động về kỹ thuật và chi phí. “Linh hồn” là bộ não lớn và bộ não nhỏ — quan trọng hơn là trí tuệ tổng quát, sự hiểu biết về thế giới, quyết định dài hạn, và liên kết đa phương thức xuyên ngôn ngữ/khác ngữ nghĩa… vẫn đang ở giai đoạn tương đối sớm.

Nhưng cũng chính vì con đường này không hề đơn giản, ở giữa có nhiều “xương cứng” cần phải cắn, nên mới rất xứng đáng để chúng tôi dồn toàn lực đầu tư, “đâm đầu” đi xử lý, đột phá.

全天候科技：Ngành robot hình người của Trung Quốc hiện có bong bóng không?

**王闯：**Bất kỳ sự phát triển công nghệ nào ở giai đoạn đầu, mọi người nhìn thấy đều sẽ thấy tương đối chậm. Nhưng đến khi nó thật sự đến như “cơn đại hồng thủy” thì mọi người lại cảm thấy quá nhanh. Hãy hình dung về xe điện. Trong nhiều năm xe điện hóa, Nhà nước đã trợ cấp và luôn thúc đẩy. Nhưng tỷ lệ người dân bình thường mua xe vẫn luôn rất thấp.

Chuyện xảy ra trong khoảng hai ba năm gần đây: dường như đột nhiên tăng tốc. Số lượng cột sạc có thể còn nhiều hơn số cây bơm xăng ở một số thành phố, và tỷ lệ thâm nhập đã vượt 50%. Tính thông minh của ô tô cũng vậy. Xe thông minh/lái xe tự động nghiên cứu hàng chục năm. Ban đầu mọi người đều cảm thấy trải nghiệm công nghệ này quá kém và không muốn dùng. Thay đổi lớn nhất nằm ở năm vừa qua: tôi tự trải nghiệm đủ loại giải pháp lái xe thông minh nhóm đầu (first-tier), và hiện đã có thể khiến tôi rất yên tâm khi sử dụng. Đây là thời điểm mang tính cách mạng.

Robot hình người cũng giống như vậy: độ phức tạp chỉ có thể ngày càng cao. Ví dụ, viễn chinh A3 hiện đã dùng rất nhiều vật liệu mới, cảm biến mới, và năng lực tính toán điều khiển trung tâm cũng được nâng lên đáng kể. Một sản phẩm phức tạp đến vậy mới vừa hạ tuyến lô đầu tiên; bên trong còn vô số vấn đề cần giải quyết. Với chúng tôi, mong muốn là từng bước đi thật vững, làm cho mọi thứ và sản phẩm thật sự tốt; đồng thời cũng kỳ vọng trong quá trình đó sẽ có nhiều đối tác, chuỗi cung ứng thượng nguồn và hạ nguồn, khách hàng cùng với chúng tôi nỗ lực để làm ra sản phẩm tốt.

Sau khi làm xong, sẽ dùng trước trong các kịch bản nằm trong khả năng làm được (lực sở năng cập). Tính tổng quát của robot ở giai đoạn ban đầu tương đối hạn chế: không thể nói giao cho nó mọi nhiệm vụ. Nhưng các nhóm nhiệm vụ đã làm được rất tốt thì vẫn có thể “khoán”. Vì tính lặp lại khi thực thi và việc chạy 24 giờ không ngủ là lợi thế tự nhiên so với con người, giúp chúng tôi làm những việc lặp đi lặp lại và nhàm chán.

Tiếp theo là chỉ lặng lẽ chờ quá trình tăng tốc. Tôi cũng không nói được là 5 năm, 10 năm hay còn dài hơn, nhưng tin rằng một ngày nào đó khi mọi người thấy nhiều robot thật sự ở xung quanh giúp chúng ta làm một số việc, mọi người sẽ cảm thấy quá trình đó diễn ra bình yên và tự nhiên, và có thể thay đổi sâu sắc xã hội. Tôi vô cùng, vô cùng mong đợi thời điểm đó; tôi sẽ cống hiến toàn bộ sự nghiệp tương lai của mình vào quá trình này, cùng các đồng nghiệp nỗ lực.

Còn về so sánh giữa Trung Quốc và quốc tế: rất rõ ràng là trên thế giới có nhiều nơi làm rất xuất sắc những đổi mới từ 0-1, trong khi Trung Quốc cũng làm rất tốt trong quá trình từ 0-100. Đặc biệt, về năng lực kỹ thuật, việc ứng dụng, và xây dựng nên “vòng quay (flywheel)” để lặp lại/tiến hóa robot, Trung Quốc làm rất xuất sắc.

Trong một hai năm gần đây, tôi có những cảm nhận rất sâu: Trung Quốc bắt đầu có các bước đột phá dần dần ở những công nghệ cốt lõi theo hướng từ 0-1 — ví dụ xúc giác của robot, thuật toán. Ở các thuật toán kết hợp giữa nhận thức và điều khiển robot (感知和控制相结合), Trung Quốc cũng có rất nhiều thứ xuất phát từ 0-1.

Tôi tin rằng trong tương lai, Trung Quốc sẽ học từ 0-1 rất nhanh và sẽ càng ngày càng tăng tốc, vì có đủ nhiều người thông minh. Nhưng việc các nước khác học từ 1-100 thì không dễ. Việc xây dựng được cả hệ thống cần nỗ lực khổng lồ và tỷ lệ thành công tương đối thấp. Tôi tin rằng trong ngành trí tuệ thân thể, Trung Quốc sẽ tiếp tục dẫn đầu toàn cầu.

全天候科技：Nhìn cuộc đua “bạn đuổi tôi bắt” hiện tại về robot hình người, mục tiêu bước tiếp theo của ZhiYuan là gì?

**王闯：**Chúng tôi không phải đang làm “cuộc thi lượng sản”. Nhà máy hiện tại chúng tôi đang ở là nhà máy pilot. Ví dụ viễn chinh A3 được sản xuất tại nhà máy này, mục đích là để xác minh toàn bộ dây chuyền. Phần lớn trong nhà máy này không dùng nhiều thiết bị tự động hóa; nó dùng để xác minh, để thiết kế, và quá trình phát triển/làm R&D cũng thường chạy qua chạy lại để lặp lại thiết kế sản phẩm. Nhà máy thực sự để lượng sản nằm ở nhà máy Phụng Hiến (奉贤工厂) và các nơi khác (các nhà máy). Nếu bây giờ chúng tôi muốn làm cuộc đua lượng sản thì công suất xa hơn nhiều so với hiện tại.

Tại sao không làm? Vì chúng tôi coi trọng hơn việc robot được dùng như thế nào trong bối cảnh thực tế, và làm sao đáp ứng nhu cầu bền vững của khách hàng. Ví dụ khách mua robot về để kiểm chứng trên dây chuyền: cần trước tiên làm POC để các chức năng chạy thông, như nhịp đạt 12 giây hay bao nhiêu đó. Khi khách thực sự hài lòng rồi, thì mới dần dần triển khai mở rộng sang các trạm tương tự khác. Đó là nhu cầu thật sự thúc đẩy.

Còn với robot hai chân, như Lingxi (灵犀) và robot viễn chinh dùng ở showroom để thuyết minh: hiện cũng đã có tổng cộng 200–300 chiếc làm việc ở các showroom khác nhau. Nếu khách thấy robot tự chạy bảo trì miễn (autonomous, miễn bảo trì), năng lực tương tác, khả năng đón tiếp, năng lực đa ngôn ngữ thật sự giúp ích cho họ, thì khi họ sẵn sàng sao chép và mở rộng hàng loạt (batch replication) chúng tôi mới là điều kỳ vọng nhất. Khi đó, chúng tôi sẽ sắp xếp công suất theo nhu cầu của khách, và sẽ không nghĩ đến việc cạnh tranh với ai. Bởi vì nếu sản xuất ra mà biến thành hàng tồn kho, thì đối với chúng tôi điều đó không có ý nghĩa.

风险提示及免责条款

        市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.