2026 Форум Чжунгуаньцунь — щорічна конференція｜Лідери у сфері тілесного інтелекту обговорюють проблему даних та прорив у сценаріях

2026-04-01 08:49:02

Генерація анотацій у процесі

(Джерело: Beijing Business News)

27 березня на щорічній конференції 2026 Zhongguancun Forum у рамках «Форуму з передових відкритих AI-ресурсів» відбулася дискусія за круглим столом навколо тілесного (embodied) інтелекту. Згідно з «China Development Report 2025», опублікованим Дослідницьким центром з розвитку Держради, розвиток індустрії тілесного інтелекту в Китаї перебуває на етапі становлення, а обсяг ринку, як очікується, досягне 400 млрд юанів у 2030 році та перевищить 1 трлн юанів у 2035 році. На старті цього трильйонного треку провідні постаті таких компаній, як Galaxy General, Qianxun Intelligent, Xingdong Jiyuan, розгорнули глибокі дебати щодо побудови «піраміди даних», архітектури «мозок—мозочок» та шляхів впровадження в реальні сценарії, обговорюючи ключові виклики та ідеї прориву, як у 2026 році тілесний інтелект вийде з лабораторії на масштабоване застосування.

Засновник Galaxy General Ван Хе: «Піраміда даних» широко застосовуватиметься у 2026 році

У 2025 році сегмент тілесного інтелекту було повністю «розігріто»: капітал ринувся в галузь, з’являється дедалі більше моделей, і деякі концепції стають дедалі яснішими, зокрема визначення мозку та мозочка для гуманоїдних роботів.

Мозок відповідає за формування виходу від сприйняття, пізнання до планування дій; мозочок, використовуючи ці виходи, у робастний спосіб виконує рухи на «тілі» з високою гнучкістю та стабільністю. Після об’єднання мозку й мозочка розблокуються завдання на кшталт маніпуляцій, навігації та рухів усього тіла.

На рівні даних тілесний інтелект формує чітку піраміду: в основі — дані з інтернету; вище — дані про поведінку людини; ще вище — синтетичні дані; на верхівці — дані з реального світу. Цю піраміду даних було створено у 2025 році, і в 2026 році її широко використовуватимуть. Тоді вся технологія, що поєднує VLA (модель візуально-мовленнєвих дій) та модель дій у світі, здійснить справжній стрибок.

Засновник і співзасновник Xingdong Jiyuan Сі Юе: побудова «фабрики даних» (data flywheel) — ключ до прориву

Наразі найбільша складність тілесного інтелекту — саме дані. Щоб робот справді міг самостійно працювати на заводі чи в спеціальних середовищах, потрібно збирати дані в реальному середовищі. Але відкриття сценаріїв складне, вартість масового збору висока, і це дуже довго.

Поширене нині рішення — відтворювати реальні сценарії: під час тренувань будувати середовище 1:1. Проте цього недостатньо для вирішення всіх проблем: покладатися на інженерів, щоб збирати дані, тренувати, розгортати й знову повторювати цикл, — цей підхід надзвичайно неефективний і дуже дорогий.

Наша відповідь — побудувати «фабрику даних» (data flywheel), замкнений цикл від збору даних до моделі, щоб робот у реальному середовищі автономно опрацьовував corner case (заплутані/нетипові граничні випадки) і безперервно підвищував ефективність. Ми також досліджуємо моделі збору даних у форматі «людина + справжня машина» (людина в парі з реальними пристроями).

Засновник і співзасновник Qianxun Гао Ян: 2025 — це ера тілесного інтелекту GPT-2.0, а 2026 зустріне GPT-3.0

У моєму розумінні в тілесному інтелекті також існують такі етапи, як GPT-2.0, GPT-3.0 тощо: у 2025 році ми перебуваємо в епосі 2.0, яка вирішила багато базових проблем інфраструктури на рівні даних і підготувала ґрунт для масштабованого розгортання ще наперед; фокус робіт 2026 року полягатиме в обробці все більших моделей, дедалі більшої кількості даних і забезпеченні ефекту масштабування.

Насправді, у процесі розвитку дуже складно насправді чітко визначити, на якому саме етапі ми перебуваємо зараз — стан схожий на те, як видно крізь туман. Я визначаю 2025 рік як передетап 2.0 або 3.0, тому що деякі моделі вже мають певні базові можливості узагальнення, як у GPT-2.0: є базова здатність до діалогу, але в багатьох випадках слова/висловлювання виявляються неточними. За результатами спільних досліджень у науці та в промисловості, дуже ймовірно, що наприкінці 2026 року або в середині 2027 року з’являться моделі на кшталт GPT-3.0.

Засновник і співзасновник Zhi Pingfang Чжан Пен: валідація сценаріїв — ключове слово 2025 року

Найважливіше у 2025 році — впровадити валідацію сценаріїв у реальність, щоб робот вийшов із лабораторії в справжні сценарії. У 2026 році більше потрібно вирішувати те, як зробити модель робота дедалі кращою.

На технічному рівні необхідно прорватися крізь обмеження узагальнення в реальних сценаріях: як з архітектури моделі, так і з системного дизайну, щоб робот міг адаптуватися до більшої кількості сценаріїв із меншими витратами. Для галузі це дуже великий виклик. Ми хочемо збирати більше даних у реальних сценаріях, на основі цих даних за допомогою синтезу та подібних методів створювати більше цінності й знижувати витрати. У реальному середовищі, на нашу думку, має бути злиття трьох компонентів — моделі, апаратного забезпечення та системи сценаріїв — щоб разом вирішувати проблеми.

Beijing Business Reporter Вей Вей

Масивні новини, точна аналітика — усе у застосунку Sina Finance

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.