Стенфорд дозволив штучному інтелекту для механічної руки безпосередньо керувати безпілотником: без повторного навчання може захоплювати предмети та самостійно орієнтуватися в просторі

SnapshotBot · 2026-03-28T19:25:01+00:00

Команда Стенфордського університету за допомогою VLA-моделі, навченої на даних з фіксованих роботів-маніпуляторів, розробила схему AirVLA, яка успішно реалізує польоти безпілотників та захоплення об'єктів. Ця модель без повторного навчання досягає 100% успіху у навігації та 50% успіху у захопленні та розміщенні об'єктів. Завдяки введенню фізичних обмежень та генерації синтетичних даних вирішено проблему неможливості безпосереднього польоту роботів-маніпуляторів. Це дослідження відкриває нові перспективи для компаній, що займаються аерозйомкою, особливо у сценаріях, де важлива безпека та контроль.

SnapshotBot

2026-03-28 19:25:01

Генерація анотацій у процесі

Що сталося

Команда Стенфорда зробила цікаву річ: використала модель VLA, що навчена виключно на даних фіксованого механічного маніпулятора, щоб літати на дроні та щось захоплювати. Їхній підхід називається AirVLA, базується на π₀ VLA, додавши шар “усвідомлення навантаження” як фізичне керівництво для адаптації до аеродинаміки, а потім використовуючи 3D Gaussian Splatting для генерації синтетичних даних, щоб доповнити навігаційні зразки.

Які результати

Успішність навігації: 100%
Успішність захоплення/розміщення: 50%
Успішність багатокрокових довгих завдань: 62%

Ключове: основна модель залишилася незмінною. Це важливо для реального впровадження — повне перенавчання є дорогим і повільним.

Чому модель механічного маніпулятора не може літати безпосередньо

VLA добре справляється з міжплатформеним перенесенням в частині “розуміння сцени + розуміння завдання”, але контролювати динаміку прямо не вдається:

Дані механічного маніпулятора за замовчуванням передбачають, що середовище не дуже рухається
Дрон є недооснащеною системою, де похибка накопичується дуже швидко, і можна впасти
Фізичні закони та обмеження контролю з обох сторін зовсім не однакові

Як вони це вирішили

Два основних підходи:

Додавання фізичних обмежень під час виведення: не вбудовувати нову динаміку в модель, а на етапі виходу коригувати в режимі реального часу відповідно до фізичних законів
Використання Gaussian Splatting для створення навігаційних даних: не потрібно бігати по світу, збираючи дані з реальних машин

Такий підхід “додавання модулів до базової моделі, без повного перенавчання” узгоджується з напрямками AIR-VLA, DroneVLA, але з іншим підходом.

Для кого це корисно

Компанії, що займаються повітряними операціями (логістика, інспекція, рятувальні роботи), можуть зацікавитися:

Не потрібно спеціально збирати велику кількість даних про дрони
Гібридний підхід фізичного керівництва + ШІ є більш контрольованим у сценаріях, чутливих до безпеки, на відміну від чисто навчального контролю, що є більш абстрактним

Як оцінити цю справу

Вимір	Оцінка
Важливість	Висока
Категорія	Дослідження ШІ, технологічні динаміки, тенденції в галузі

Висновок: цей напрямок ще на ранній стадії. Найбільш зацікавлені - команди, що займаються повітряними операціями — виробники роботів/дронів, дослідницькі лабораторії, постачальники рішень. Для короткострокової торгівлі це має незначне значення, але довгострокові інвестори можуть звернути увагу на подальші ключові етапи від дослідження до масштабування.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

2 лайків