Роботы «не насытятся», реальные данные по-прежнему остаются важнейшей областью борьбы за телесный интеллект

robot
Генерация тезисов в процессе

Проблемы с данными — одна из ключевых задач, с которой сталкивается индустрия робототехники при интеллектуальной модернизации в настоящее время.

28 марта, в качестве параллельного форума в рамках Чжунгуаньцуньского форума, на месте проведения 2026 China International Conference on Sci-Fi в Пекине, в районе Шицзиншань, Центр по подготовке и инновациям по тактильному восприятию для воплощённого интеллекта и мультимодальному распознаванию был официально открыт.

Как стало известно корреспонденту, этот центр создан компанией Beijing Shijingshan Technology Innovation Group Co., Ltd. совместно с He Shan Technology. Он ориентирован на потребности развития индустрии воплощённого интеллекта, определил три ключевых технологических направления: тактильность, гетерогенность и автономный сбор данных без участия людей, и создал платформу полного цикла трансформации технологий, объединяющую сбор мультимодальных данных, алгоритмическое обучение и внедрение в сценарии.

Проблемы с данными — одна из ключевых задач, с которой сталкивается индустрия робототехники при интеллектуальной модернизации в настоящее время. На этапе «Беседа о воплощённом интеллекте на 10 миллиардов» Чжунгуаньцуньского форума сооснователь Xingdong Yuan席悦 считает, что наибольшая сложность в развитии воплощённого интеллекта сегодня всё ещё связана с данными.

С точки зрения конкретных сценариев внедрения в бизнес, Си Юэ считает: сбор данных в реальных сценариях сопряжён с высокой сложностью — требуется, чтобы площадка открывала разрешения. При этом при масштабном сборе возникают проблемы высокой стоимости и длительного времени. А существующие альтернативные решения имеют ограничения: распространённая в отрасли модель «1:1 копирования реальных сценариев с построением тренировочного полигона» из-за того, что она зависит от постоянного участия инженеров в сборе, обучении, развёртывании и поиске причин проблем, приводит к низкой общей эффективности и высокой стоимости.

Си Юэ считает, что отрасль может выстроить замкнутый контур «сбор данных — итерации модели», чтобы роботы могли автономно обрабатывать в реальной среде любые экстремальные ситуации и постоянно повышать эффективность системы. Во-вторых, следует продвигать комбинированный режим «демонстрации человеком + сбор на реальных машинах», однако на данный момент всё ещё нужно решить задачу по прорыву различий между ними в параметрах компоновки робота, формах движений и способах восприятия.

Основатель Yuanli Lingji 唐文斌 признаёт, что данные — одно из нынешних «бутылочных горлышек» воплощённого интеллекта, но это не вся проблема. По его мнению, сбор данных по сути является вопросом денег и времени: при инвестировании в закупку роботов, строительстве тренировочных полигонов, найме операторов теледемонстрации, а также аутсорсинге разметки можно быстро нарастить объём данных — миллионы часов и масштабы вплоть до миллиардов образцов. Поэтому «есть ли данные или нет» не является отраслевым барьером. По-настоящему конкурентное преимущество заключается в том, может ли компания обеспечить автоматический возврат данных из реальных сценариев и построить замкнутый контур эффективного «data flywheel».

Сейчас Zhi Ping уже располагает несколькими путями получения данных, но возвращаясь к реальности, сооснователь 张鹏 по-прежнему считает, что ценность данных из реальных сценариев незаменима — и это то направление, которое отрасли сегодня нужно в первую очередь прорабатывать. В частности, наиболее ценная часть данных-актива — это та, которая реализуется через продукт, внедрённый на передовой в практическую эксплуатацию, обеспечивая возврат данных и их последующее накопление. При соблюдении безопасности Zhi Ping также будет делиться с клиентами этой частью данных.

Как выяснил корреспондент, на данный момент четвёртая очередь проекта Пекинского центра по сбору данных и обучению человекоподобных роботов в районе Шицзиншань в основном сотрудничает с компаниями Leju, He Shan, Ruilman, Lingchu и др., предпринимая попытки решить проблему дефицита данных и «бутылочного горлышка» по качеству в отрасли робототехники.

Относительно текущих проблем спроса и предложения данных в робототехнике один представитель отрасли сообщил корреспонденту следующее: в настоящее время область воплощённого интеллекта проходит через реконструкцию структуры данных. Благодаря появлению бескаркасных данных по телесности, таких как EGO для перспективы от первого лица и решение UMI для универсальных интерфейсов операций, фабрики по сбору теледанных, которые ранее развивались за счёт вложений в тяжёлые активы, могут столкнуться с трудностями в развитии.

По измерению ценности данных, этот представитель отмечает: данные из реальных сценариев всё ещё являются «верхней точкой пирамиды» — тем типом данных, который нужен для обучения роботных моделей, но в отрасли в целом есть две ключевые проблемы. Во-первых, отсутствует стандартизация для качества данных и проектирования дата-пайплайнов. Во-вторых, существует существенная отраслевая «пропасть» в возможностях обработки данных: не все производители обладают технической силой, чтобы строить эффективную систему обработки данных. Кроме того, в отрасли отсутствует единый механизм обмена технологическими ноу-хау по данным и нет базовой системы бенчмаркинга, из-за чего эффективность применения данных различается.

Этот представитель добавил: если в будущем технологии бескаркасных данных по телесности, такие как EGO и UMI, смогут получить широкое распространение, можно будет ещё сильнее усилить ключевую дефицитность ресурсов сценариев. Со стороны компаний также появится возможность снизить зависимость от традиционных фабрик по сбору данных и напрямую выполнять сбор данных в реальных сценариях. Доступность и разнообразие сценариев станут ключевыми переменными конкурентоспособности данных.

Таким образом, исходя из тенденций технологического обновления и итераций, воплощённому интеллекту нужны данные для обучения в масштабе миллиардов часов, однако текущего общего объёма всё ещё явно недостаточно. При этом часть ключевых активов, которые были смещены относительно основных технологических направлений, в будущем может столкнуться с риском обесценивания: например, когда опора делается на роботов конкретной телесности и на центры с фиксированными площадками и тяжёлой инфраструктурой, может возникать снижение загрузки производственных мощностей и резкий рост удельной стоимости.

В долгосрочной перспективе основная логика конкурентоспособности в сфере данных претерпит коренной перелом: от «соревнования аппаратных средств за наличие масштабируемых центров обучения» к способности получать данные из реальных сценариев, к эффективности итераций замкнутого контура «сценарий — данные» и к т. п.

Огромный поток новостей, точные разъяснения — всё в приложении Sina Finance APP

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить