Посещение инновационного центра гуманоидных роботов Пекина и базы данных: поставлено более десятков тысяч часов высококачественных аутентичных данных

robot
Генерация тезисов в процессе

В ключевой период перехода искусственного интеллекта от «когнитивного интеллекта» к «телесному интеллекту» высококачественные данные стали стратегическим ресурсом, стимулирующим развитие индустрии гуманоидных роботов. Недавно журналисты «Цзяньцзюнь Шибао» посетили первую очередь базы данных и тренировочной площадки по телесному интеллекту в Центре инноваций гуманоидных роботов в Пекине.

Здание базы данных занимает около 5000 квадратных метров и охватывает более 30 типичных сценариев в сферах домашнего хозяйства, супермаркетов, офисов, промышленности, медицины и здравоохранения. В наличии есть профессиональная площадка для оптического захвата движений площадью около 200 квадратных метров. База данных располагает более 120 роботов с наиболее богатой конфигурацией в стране, оснащённых устройствами для сбора данных в виде головных обручей и захватных рук, а также профессиональным оборудованием — костюмами для захвата движений, перчатками и дистанционными кабинами управления. Она обладает полным спектром возможностей по сбору данных, включая управление реальными машинами, сбор данных в открытых условиях и захват движений, а также внедрила стандартизированную систему управления проектами и разработала нормативы по сбору, маркировке и контролю качества данных, обеспечивая полный контроль качества на всех этапах.

Руководитель Центра инноваций гуманоидных роботов в Пекине рассказал журналистам «Цзяньцзюнь Шибао», что строительство первой очереди базы заняло всего полгода и уже стала одной из самых полно охватывающих сценарии, с наиболее богатой конфигурацией роботов и самой высокой производительностью и качеством данных в стране.

По информации, в настоящее время Центр инноваций гуманоидных роботов в Пекине выпустил и открыл исходный код набора данных Robomind по телесному интеллекту, который был скачан более 2 миллионов раз. Кроме того, коммерческая доставка высококачественных реальных данных из базы данных превысила десятки тысяч часов, а объем скачиваний и возможности поставки данных занимают лидирующие позиции в отрасли.

Этот руководитель отметил, что клиенты базы данных включают несколько ведущих компаний и научных институтов в области телесного интеллекта. Сценарии применения охватывают логистику, супермаркеты, офисы, домашнее хозяйство и другие области. В связи с внедрением универсальной платформы роботов «Телесное Тянгун» в различных сценариях, база данных стремительно движется к цели стать «первой в мире с миллионом часов высококачественных данных», укрепляя основу для перехода гуманоидных роботов из лабораторий в различные отрасли.

Для того чтобы гуманоидные роботы действительно вошли во все сферы, нужны не только сотни или тысячи «отточенных» данных, а огромные, разнообразные и высококачественные «сырьевые» данные. Важнейшим этапом является сбор реальных данных, которые позволяют роботам перейти от виртуальной модели к реальности. Реальные данные точно воспроизводят тактильные ощущения, обратную связь, информацию о воздействии окружающей среды и другие детали, которые трудно смоделировать. Эти ключевые сведения, называемые «физической интуицией», могут быть получены только через мультимодальные данные, собранные с помощью реальных устройств. Более того, в реальных условиях полное выполнение задач, таких как «захват — манипуляция — размещение», содержит множество скрытых решений, принятых человеком в сложных ситуациях, что значительно повышает ценность таких данных по сравнению с другими типами.

Однако сбор реальных данных сталкивается с рядом проблем, включая фрагментацию сценариев, различия в диалектах роботов и неоднородность качества данных.

На основе анализа отраслевых проблем Центр инноваций гуманоидных роботов в Пекине спроектировал специализированную базу данных для сбора данных. Она объединяет разрозненные сценарии, унифицирует управление различными роботами и стандартизирует весь цикл — от сбора и маркировки до контроля качества.

Ранее Центр разработал и принял первый в стране отраслевой стандарт по сбору данных для телесного интеллекта «Нормы сбора данных для искусственного интеллекта с телесным интеллектом», установив стандарты и процедуры для профессионального и стандартизированного сбора данных. База данных уже поставила более десятков тысяч часов высококачественных данных для ведущих компаний и научных учреждений, при этом уровень соответствия стандартам стабильно превышает 95%.

По информации, каждый час данных в базе проходит строгую проверку, обеспечивая «проходной уровень» более 95%. Также различные конфигурации роботов могут собирать данные параллельно, что позволяет масштабировать производство высококачественных данных и избавляет команды алгоритмов от проблем с нехваткой данных.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить