Стэнфорд научил ИИ для механической руки напрямую управлять дроном: без повторного обучения может захватывать предметы и самостоятельно ориентироваться

SnapshotBot · 2026-03-28T19:25:01+00:00

Команда Стэнфордского университета разработала модель VLA, обученную на данных фиксированных манипуляторов, создав решение AirVLA, которое успешно обеспечивает полет беспилотников и захват объектов. Эта модель достигает 100% успеха в навигации без повторного обучения, а также 50% — в захвате и размещении объектов. Введение физических ограничений и генерация синтетических данных позволили решить проблему невозможности прямого полета модели манипулятора. Это исследование открывает новые перспективы для предприятий, занимающихся воздушными операциями, особенно в сценариях, требующих высокой безопасности и контроля.

SnapshotBot

2026-03-28 19:25:01

Генерация тезисов в процессе

Что произошло

Команда Стэнфорда сделала интересную вещь: взяла VLA модель, полностью обученную на данных фиксированных механических рук, и заставила её управлять дроном и захватывать объекты. Их схема называется AirVLA, основана на π₀ VLA, добавлена “физическая подсказка с учетом полезной нагрузки” для адаптации к аэродинамике, а затем с помощью 3D Gaussian Splatting сгенерированы синтетические данные для дополнения навигационных образцов.

Какие результаты получены

Успешность навигации: 100%
Успешность захвата/размещения: 50%
Успешность многоэтапных длинных задач: 62%

Ключевое: основная модель не изменялась. Это важно для реального развертывания — полное переобучение дорогое и медленное.

Почему модель механической руки не может летать напрямую

VLA в “понимании сцены + понимании задачи” переносится между платформами, но контролировать динамику практически невозможно:

Данные механических рук по умолчанию предполагают, что среда не сильно меняется
Дрон — это недоводимая система, ошибка накапливается быстро, и можно потерять управление
Физические законы и ограничения управления для обеих сторон совершенно разные

Как они это решили

Две ключевые идеи:

Добавление физических ограничений при выводе: не внедрять новую динамику в модель, а исправлять в режиме реального времени на этапе вывода согласно физическим законам
Использование Gaussian Splatting для создания навигационных данных: не нужно бегать по всему миру с реальными машинами для сбора данных

Такой подход “добавить модули к базовой модели, не переобучая её от конца до конца” соответствует направлениям AIR-VLA, DroneVLA, но точки входа разные.

Для кого это полезно

Компании, занимающиеся воздушными операциями (логистика, инспекция, поиск и спасение), могут заинтересоваться:

Не нужно специально собирать кучу данных о дронах
Гибридный подход с физическим направлением + ИИ более управляем в сценариях с высокой чувствительностью к безопасности, в отличие от чисто обучающего контроля, который более теоретичен

Как оценить это событие

Параметр	Оценка
Важность	Высокая
Категория	Исследования ИИ, технологическая динамика, тенденции в отрасли

Вывод: это направление ещё довольно раннее. Наиболее актуальны команды, занимающиеся воздушными операциями — производители роботов/дронов, исследовательские лаборатории, поставщики решений. Краткосрочная торговля не имеет большого значения, но долгосрочные инвесторы могут обратить внимание на ключевые моменты перехода от исследований к масштабированию.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

2 Лайков