Стэнфорд научил ИИ для механической руки напрямую управлять дроном: без повторного обучения может захватывать предметы и самостоятельно ориентироваться

robot
Генерация тезисов в процессе

Что произошло

Команда Стэнфорда сделала интересную вещь: взяла VLA модель, полностью обученную на данных фиксированных механических рук, и заставила её управлять дроном и захватывать объекты. Их схема называется AirVLA, основана на π₀ VLA, добавлена “физическая подсказка с учетом полезной нагрузки” для адаптации к аэродинамике, а затем с помощью 3D Gaussian Splatting сгенерированы синтетические данные для дополнения навигационных образцов.

Какие результаты получены

  • Успешность навигации: 100%
  • Успешность захвата/размещения: 50%
  • Успешность многоэтапных длинных задач: 62%

Ключевое: основная модель не изменялась. Это важно для реального развертывания — полное переобучение дорогое и медленное.

Почему модель механической руки не может летать напрямую

VLA в “понимании сцены + понимании задачи” переносится между платформами, но контролировать динамику практически невозможно:

  • Данные механических рук по умолчанию предполагают, что среда не сильно меняется
  • Дрон — это недоводимая система, ошибка накапливается быстро, и можно потерять управление
  • Физические законы и ограничения управления для обеих сторон совершенно разные

Как они это решили

Две ключевые идеи:

  1. Добавление физических ограничений при выводе: не внедрять новую динамику в модель, а исправлять в режиме реального времени на этапе вывода согласно физическим законам
  2. Использование Gaussian Splatting для создания навигационных данных: не нужно бегать по всему миру с реальными машинами для сбора данных

Такой подход “добавить модули к базовой модели, не переобучая её от конца до конца” соответствует направлениям AIR-VLA, DroneVLA, но точки входа разные.

Для кого это полезно

Компании, занимающиеся воздушными операциями (логистика, инспекция, поиск и спасение), могут заинтересоваться:

  • Не нужно специально собирать кучу данных о дронах
  • Гибридный подход с физическим направлением + ИИ более управляем в сценариях с высокой чувствительностью к безопасности, в отличие от чисто обучающего контроля, который более теоретичен

Как оценить это событие

Параметр Оценка
Важность Высокая
Категория Исследования ИИ, технологическая динамика, тенденции в отрасли

Вывод: это направление ещё довольно раннее. Наиболее актуальны команды, занимающиеся воздушными операциями — производители роботов/дронов, исследовательские лаборатории, поставщики решений. Краткосрочная торговля не имеет большого значения, но долгосрочные инвесторы могут обратить внимание на ключевые моменты перехода от исследований к масштабированию.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить