Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Launchpad
Đăng ký sớm dự án token lớn tiếp theo
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Tiệc rót vốn mô hình thế giới đang diễn ra sôi động, các nhà đầu tư đặt cược vào lĩnh vực AI vật lý trị giá hàng nghìn tỷ
Nhà báo Thời báo Chứng khoán: Chen Yukan
Cơn sốt “tôm hùm” (OpenClaw) nổi lên trong năm nay cho thấy phần nào mặt không giới hạn của trí tuệ nhân tạo (AI): nó có thể bắt dữ liệu, viết mã, tạo ra những thước phim hoành tráng, và thậm chí tiếp quản máy tính. Tuy nhiên, một khi rời khỏi màn hình, khi robot đối mặt với thế giới thực, nó giống như một đứa trẻ ngây ngô: chỉ có thể hoàn thành các động tác cố định, theo quy trình. “Nghịch lý Moravec” chắn ngang con đường của con người hướng tới trí tuệ nhân tạo tổng quát (AGI).
Mô hình thế giới chính là chìa khóa để giải quyết nghịch cảnh này. Nó có thể giúp robot thực sự hiểu các quy luật của thế giới vật lý, có năng lực suy nghĩ và suy luận, đồng thời là lộ trình quan trọng để đạt được AGI. Trong năm nay, người đoạt giải Turing Yang Yukun đã thành lập công ty mô hình thế giới; công ty mô hình thế giới của “nữ hoàng AI” Li Feifei nhận được khoản đầu tư mồi khổng lồ; trong nước xuất hiện hơn 20 sự kiện tài trợ liên quan đến mô hình thế giới. Trong ngành, người ta gọi thẳng mô hình thế giới có lẽ là “cửa gió” quan trọng cho 10 năm tới của AI.
Một số nhà doanh nghiệp trong lĩnh vực AI cho biết với phóng viên Thời báo Chứng khoán rằng, mô hình thế giới có thể giúp AI thực sự đạt được khả năng hiểu và tương tác với thế giới vật lý. Đây là con đường tất yếu để đạt AGI. Hiện tại, phát triển mô hình thế giới vẫn đang ở giai đoạn sớm; ai có thể là người đầu tiên “bẻ lái” được vòng quay dữ liệu tương tác vật lý, thì người đó sẽ giành được lợi thế đi trước.
AI cần bén rễ trong thế giới thực
OpenAI mới đây đã công bố đóng ứng dụng tạo video Sora và điều chỉnh hướng chiến lược: từ đây, đội ngũ Sora sẽ tập trung nghiên cứu mô hình thế giới.
Bỏ việc tạo ra hiện thực bằng AI, chuyển sang để AI hiểu hiện thực — quyết định của OpenAI phản ánh “cao địa chiến lược” tiếp theo của ngành: mô hình thế giới. Theo phần giải thích của các trường đại học như Đại học Phục Đán, mô hình thế giới hiểu thế giới vật lý bằng cách học và dự đoán các đặc tính động như chuyển động, lực và quan hệ không gian từ dữ liệu giác quan. Nhờ mô hình thế giới, AI chuyển từ nhận thức, nhận dạng sang hiểu và suy luận — đồng thời là nền tảng cho trí tuệ gắn thân và tương tác khách quan với môi trường một cách tự chủ, hiệu quả.
Trợ lý hiệu trưởng Học viện Quản trị Đại học Phục Đán, Trưởng khoa Quản lý Thông tin và Trí tuệ Kinh doanh Zhang Cheng cho biết trong cuộc phỏng vấn với phóng viên Thời báo Chứng khoán rằng, bản chất của “việc AI ‘suy nghĩ’” là dự đoán xác suất dựa trên thống kê dữ liệu; thiếu thực sự cảm xúc và nhận thức sâu sắc về thế giới. Gốc rễ của vấn đề nằm ở chỗ mô hình chủ yếu được xây dựng trên dữ liệu ngôn ngữ. Khi mô hình chỉ học thế giới thông qua văn bản thì giới hạn nhận thức cũng bị giới hạn trong phạm vi mà ngôn ngữ có thể biểu đạt; còn mô hình thế giới có thể giúp hệ thống khắc họa quy luật vận hành của môi trường thông qua thông tin đa phương thức, bao gồm thị giác, thính giác, động lực học không gian…
苗桢, người phụ trách kiểm toán khu vực Đông và Tây Trung Quốc của ngành ô tô tại KPMG, cho biết trong cuộc phỏng vấn với phóng viên Thời báo Chứng khoán rằng, giá trị cốt lõi của mô hình thế giới nằm ở chỗ xây dựng một “thế giới song song ảo” phù hợp với các quy tắc vật lý, thông qua hiểu không gian môi trường, suy diễn dự đoán chuỗi thời gian dài để tạo đầu ra quyết định, từ đó hiện thực hóa suy diễn kịch bản, dự đoán quan hệ nhân quả và bao phủ các tình huống đuôi dài. Nó bù đắp cho điểm yếu mà các mô hình thuần dựa trên dữ liệu có: năng lực tổng quát hóa với các tình huống đuôi dài cực đoan còn thiếu.
Nếu không có mô hình thế giới, trần năng lực của robot rất có thể chỉ là công cụ tự động hóa nâng cao để thực thi một cách thụ động mã lệnh. Người sáng lập kiêm CEO của công ty công nghệ Kuwo He Yao đã liệt kê với phóng viên Thời báo Chứng khoán các khó khăn thực tế khi triển khai robot dọn vệ sinh của công ty trong bối cảnh đô thị: robot có thể né tránh khi gặp tường tiêu chuẩn, nhưng khi tiến gần các cành cây bị gãy hoặc vật đống không đều, do trong mã lệnh cài sẵn không có định nghĩa cho loại vật thể đó, hệ thống sẽ phán định là chướng ngại không thể đi qua, khiến robot phải dừng tại chỗ. “Nếu có mô hình thế giới, hệ thống có thể dự đoán dựa trên vật liệu và đặc tính vật lý, lập kế hoạch quỹ đạo vòng qua, thậm chí ở điều kiện an toàn có thể dùng lực nhẹ để đẩy vật thể đi qua, duy trì công việc liên tục.”
Đại tiệc tài trợ mô hình thế giới đang diễn ra rầm rộ
Dựa trên triển vọng và tiềm năng của mô hình thế giới, trong và ngoài nước, các quỹ vốn đã dồn rất nhiều tiền vào. Tháng 2 năm nay, doanh nghiệp mô hình thế giới do Li Feifei sáng lập hoàn tất vòng gọi vốn 1 tỷ USD; không lâu sau, công ty khởi nghiệp mô hình thế giới AMI của Yang Yukun cũng hoàn tất hơn 1 tỷ USD huy động vốn.
Trong nước, theo dữ liệu do Qichacha cung cấp, kể từ đầu năm nay, trong nước đã xảy ra 25 sự kiện tài trợ liên quan đến mô hình thế giới, tổng số tiền huy động vượt 2,2 tỷ NDT. Trong đó, tháng 3, công ty 极佳视界 tuyên bố hoàn tất vòng Pre-B 10 tỷ NDT và cùng tháng cũng công bố mô hình thế giới gắn thân GigaWorld-1 của họ lên vị trí số 1 trên bảng WorldArena.
“‘Cơn sốt tài trợ’ của mô hình thế giới cho thấy sự đồng thuận trong ngành đang hình thành: AI từ thế giới số chuyển sang thế giới vật lý là chiến trường chủ lực tiếp theo.” Người liên quan đến Zhìngláng Zhìngnéng cho biết trong cuộc phỏng vấn với phóng viên Thời báo Chứng khoán. “Trong 10 năm qua, bước nhảy năng lực của AI chủ yếu diễn ra ở tầng nhận thức và ngôn ngữ. Nhưng để thực sự bước vào thế giới vật lý, cần phải hiểu quy luật vận hành của thế giới vật lý: quan hệ không gian, quan hệ nhân quả và thuộc tính vật lý.”
Người nói trên cho biết thêm rằng, việc vốn đầu tư đặt cược vào mô hình thế giới, về bản chất là đặt cược vào “đường đua quy mô hàng nghìn tỷ” của AI vật lý. Trong tương lai, lộ trình công nghệ có thể chuyển từ “một hệ thống thống nhất” sang phân công chuyên môn hóa: mô hình thế giới chịu trách nhiệm trực giác vật lý; mô hình thị giác—ngôn ngữ—hành động (VLA) chịu trách nhiệm hiểu ngữ nghĩa; lớp điều khiển nền chịu trách nhiệm thực thi chính xác. Phân công rõ ràng thì vốn cũng có thể tìm điểm xâm nhập chính xác hơn.
He Yao nói với phóng viên Thời báo Chứng khoán rằng, kể từ năm 2026, các đợt tài trợ dày đặc với giá trị lớn dành cho mô hình thế giới cho thấy vốn và giới công nghệ đều nhất trí rằng “trạm tiếp theo của mô hình ngôn ngữ lớn là thế giới vật lý”, và mô hình thế giới là con đường bắt buộc để dẫn tới AI vật lý; đó là “thời khắc ChatGPT” của trí tuệ gắn thân sắp đến. Trong cạnh tranh ngành mô hình thế giới ở tương lai, doanh nghiệp nắm được đầu vào dữ liệu vật lý theo quy mô và hiện thực hóa vòng khép kín thương mại mới có thể dẫn dắt cuộc cách mạng công nghệ này.
Có thể khiến robot giống “con người” hơn
Trong vài năm qua, AGI kỹ thuật số dựa trên mô hình ngôn ngữ lớn đã tái định hình thế giới kỹ thuật số. Khoảng một nửa GDP toàn cầu nằm ở thế giới vật lý; AGI vật lý vẫn còn không gian tăng trưởng vô hạn. Nền tảng để AGI vật lý cất cánh nằm ở mô hình thế giới. Dựa trên tích lũy công nghệ và dữ liệu trước đó của mô hình end-to-end và mô hình theo ngành dọc (vertical), trong năm nay nhiều doanh nghiệp AI đã đưa “điểm tựa” kinh doanh của mình vào mô hình thế giới.
Tháng 2, Kuwo Technology đã công bố Coowa WAM 2.0 — mô hình thế giới phổ dụng. He Yao cho biết với phóng viên rằng việc ra mắt mô hình thế giới này nhằm giải quyết hai vấn đề phổ biến trong ngành trí tuệ gắn thân: “thiếu năng lực khái quát hóa” và “giới hạn trần phát triển của ngành”. Trước đây, ngành thường phụ thuộc vào mô hình end-to-end do quy tắc điều khiển hoặc chỉ phục vụ một bối cảnh đơn lẻ; còn mô hình WAM 2.0 giúp các thực thể AI vật lý đa dạng có được năng lực hiểu biết thường thức, suy diễn hình học và dự đoán quan hệ nhân quả đối với thế giới vật lý phức tạp.
Cũng giống như “vòng quay dữ liệu” của mô hình ngôn ngữ lớn dựa trên văn bản trên Internet, quá trình lặp của mô hình thế giới cũng dựa vào dữ liệu tương tác có giá trị do các thiết bị vật lý đầu cuối tạo ra trong thế giới thực. He Yao nói rằng công ty dự định đưa trực tiếp robot dạng “quản gia đô thị” gắn mô hình WAM 2.0 vào các tuyến phố và khu vực trong đô thị để vận hành thường xuyên. Đồng thời với việc tạo doanh thu thương mại, dữ liệu thế giới vật lý chất lượng cao sẽ liên tục được thu hồi và trả về để bồi dưỡng cho vòng lặp nâng cấp mô hình.
Zhìngláng Zhìngnéng là doanh nghiệp hàng đầu trong phân khúc robot phục vụ, với tỷ lệ sản lượng robot phục vụ thương mại đứng đầu toàn cầu. Năm ngoái, công ty đã công bố mô hình VLA đầu tiên trên thế giới cho ngành phục vụ có tên KOM2.0.
Người liên quan của Zhìngláng Zhìngnéng mới đây tiết lộ với phóng viên Thời báo Chứng khoán rằng công ty đang tích cực tìm cách hợp nhất mô hình VLA với mô hình thế giới. Điểm yếu của mô hình VLA là thiếu hiểu biết về quan hệ nhân quả trong thế giới vật lý, nên khó dự đoán các hệ quả vật lý do hành động tạo ra. Mô hình thế giới là chìa khóa để đi tới “học ít dữ liệu” và “khái quát hóa không cần dữ liệu mẫu”. Nó cho phép robot mô phỏng trong “đầu” các hệ quả của hành động, rồi lựa chọn chiến lược tối ưu.
“Vẫn là mô hình thế giới — đó là nền tảng để thực hiện tương tác an toàn giữa người và máy. Trong bối cảnh dịch vụ, robot cần dự đoán hệ quả hành động, ví dụ khi đưa đồ thì lực có quá mạnh hay không. Nếu không có mô hình thế giới, robot không thể thực sự hiểu các chuỗi quan hệ nhân quả đó.” Người phụ trách nói trên đề cập rằng: “Trong năm nay, công ty sẽ thử nghiệm đưa năng lực dự đoán của mô hình thế giới vào một số bối cảnh để nâng cao khả năng thích ứng với môi trường và mức độ an toàn của robot.”
Công ty Shanghai Kepler Robotics Co., Ltd. (sau đây gọi là “Kepler”), tập trung vào bối cảnh công nghiệp và phát triển “robot áo xanh” cho nghiên cứu phát triển, cũng bắt đầu xây dựng mô hình thế giới công nghiệp và mô hình thế giới gia đình. Khi được phỏng vấn bởi phóng viên Thời báo Chứng khoán, CTO của Kepler, Xi Ao, cho biết công ty dự kiến trước hết tích hợp mô hình thế giới công nghiệp với VLA công nghiệp, và thông qua các POC (kiểm chứng tính khả thi) quy mô nhỏ để xác minh hiệu quả, làm nền tảng cho việc triển khai quy mô lớn trong tương lai.
Các “đê dữ liệu” có thể quyết định năng lực cạnh tranh của mô hình thế giới
Năm ngoái được gọi là năm “khai sinh trí tuệ gắn thân” (embodied intelligence). Trong khi robot “phô diễn tài nghệ” bằng những động tác như múa may, thì cũng lộ rõ điểm đau vì chưa đủ thông minh. Khi ngày càng nhiều doanh nghiệp hướng sang mô hình thế giới, một số người trong ngành thẳng thắn cho rằng năm 2026 có lẽ là năm tạo nền tảng cho AGI. Jim Fan, quản lý robot của NVIDIA, năm nay từng đăng bài cho rằng năm 2026 sẽ là năm đầu tiên đặt nền tảng thật sự cho robot và rộng hơn là AI đa phương thức dựa trên mô hình thế giới lớn.
Dù kỳ vọng về triển vọng rất rộng và tốc độ tiến hóa đáng kể, nhưng đường đua mô hình thế giới vẫn ở giai đoạn sớm; trong ngành, chưa hình thành một khuôn mẫu kỹ thuật thống nhất và trưởng thành. Điều khiến giới công nghệ lo lắng hơn nữa là dữ liệu thế giới vật lý chất lượng cao rất hiếm, điều này hạn chế nghiêm trọng việc mô hình thế giới phổ biến rộng rãi.
He Yao cho biết, sự tiến hóa của mô hình thế giới sẽ gắn chặt với ba giai đoạn lớn của ngành trí tuệ gắn thân: từ quá trình chuyển đổi tự động hóa theo bối cảnh dọc hiện tại, sang phối hợp tác nghiệp theo kịch bản trong hai năm tới, rồi đến việc phổ cập bối cảnh gia đình trong 3 đến 5 năm sau. Hiện ngành đang ở giai đoạn then chốt để chuyển từ giai đoạn một sang giai đoạn hai. Thách thức ở giai đoạn hiện nay là sự thiếu hụt nghiêm trọng dữ liệu tương tác vật lý thật sự đa phương thức và chất lượng cao.
“Dữ liệu thao tác không thể hoàn toàn dựa vào dữ liệu video từ Internet hay dữ liệu mô phỏng trên máy tính. Nói cách khác, không thể trồng được mô hình thế giới thật sự trong nhà kính; chỉ dựa vào dữ liệu mô phỏng trên đám mây không thể giải quyết vấn đề vô tận các tình huống đuôi dài trong thế giới vật lý.” He Yao nói.
Người phụ trách của Zhìngláng Zhìngnéng cho biết với phóng viên rằng trong ngắn hạn, VLA kết hợp học tăng cường đã có thể giải quyết nhiều vấn đề thực tế. Nhưng xét trong trung hạn của sự phát triển trí tuệ gắn thân, khi robot đi vào môi trường cởi mở và phức tạp hơn (như gia đình và nơi công cộng), hệ thống thiếu mô hình thế giới sẽ gặp “nút thắt” khái quát hóa. Khi đó, các bên sở hữu năng lực mô hình thế giới sẽ hình thành lợi thế thế hệ. Xét dài hạn, mô hình thế giới sẽ là năng lực bắt buộc đối với robot đa dụng.
“Các rào cản dữ liệu đang hình thành; lợi thế của người đi trước là vô cùng quan trọng. Việc thu thập dữ liệu vật lý chất lượng cao và sử dụng theo chuẩn mực là thách thức cốt lõi.” Người phụ trách nhấn mạnh rằng, vốn đầu tư đặt cược vào việc doanh nghiệp có chạy thông suốt được “dữ liệu—mô hình—bối cảnh” hay không. Nếu doanh nghiệp có thể hoàn thành triển khai theo quy mô trong bối cảnh thực tế trước, thì có thể tạo ra lợi thế của người đi trước.