Конкуренция в области воплощенного интеллекта вступает в новую фазу. После того как компания Yushu Technology выпустила большую модель WVLA 2.0 и завершила демонстрацию без дистанционного управления, отрасль все четче осознает: ключевой барьер в этой гонке — не просто масштаб модели, а полная стековая способность, охватывающая архитектуру с низкой задержкой, интеграцию программно-аппаратных средств и накопление данных о самом объекте.

Согласно отчету Nomura International от 28 июня, аналитики посетили Yushu 15 июня. В демонстрации робот G1, оснащенный WVLA 2.0 (World-model Vision-Language-Action), в условиях помех в конференц-зале без дистанционного управления самостоятельно выполнил шесть последовательных задач с временем цикла вывода около 90 мс, что соответствует примерно десяти итерациям в секунду. Это первая версия с потенциалом коммерческого развертывания после двух лет разработки Yushu. Руководство называет промышленное производство — сборку серводвигателей, загрузку/выгрузку и обработку оснастки — первыми сценариями коммерческого внедрения, а крупномасштабные данные о реальной эксплуатации от глобального парка роботов считает ключевым активом.

Отчет Nomura также рассматривает архитектурный фреймворк NeuralAxis, представленный NXP на COMPUTEX 2026. Этот фреймворк был предложен президентом и генеральным директором NXP Рафаэлем Сотомайором, и его основная идея сильно перекликается с инженерным путем Yushu: реальное узкое место физического ИИ заключается не в масштабе вывода языковых моделей, а в возможности построить периферийный уровень управления, подобный спинномозговым рефлексам человека, с задержкой до 40 мс.

Прямое значение этих событий для инвесторов: конкурентная среда воплощенного интеллекта смещается от «у кого модель сильнее» к «у кого система полнее». Ров, созданный Yushu за счет полной стековой самостоятельной разработки и преимущества реальных данных, трудно воспроизвести поставщикам чисто облачных моделей.

NeuralAxis: переопределение системной архитектуры физического ИИ

Фреймворк NeuralAxis от NXP, вдохновленный нервной системой человека, разделяет логику управления физическим ИИ на три развязанных, но скоординированных уровня: уровень вывода, соответствующий коре головного мозга (задержка около 300 мс), уровень координации, соответствующий мозжечку (отвечает за управление движением и баланс), и уровень рефлексов, соответствующий спинному мозгу — задержка до 40 мс, развернутый на периферии рядом с исполнительными механизмами.

Для человекоподобных роботов значение этого фреймворка наиболее глубокое.

NeuralAxis предлагает заменить централизованный «главный мозг» распределенными рефлекторными процессорами — развернуть локальные возможности принятия решений в суставах, кистях и стопах, обеспечивая локальное выполнение таких действий, как управление силой захвата и равновесие голеностопа, и цепное восстановление баланса, захвата, позы и походки в пределах 40 мс. Развязка вывода и управления движением также позволяет добавлять новые навыки, сохраняя стабильность движения.

Коммерческие последствия этого фреймворка также заслуживают внимания. Согласно отраслевым исследованиям Nomura, по сравнению с традиционными решениями автоматизации, архитектура NeuralAxis может значительно повысить эффективность производства, а продажи диагностических роботов, как ожидается, значительно вырастут. Кроме того, та же архитектура может сжать сквозную задержку для беспилотников до 20 мс и расслоить логику управления программно-определяемых автомобилей на уровни вывода, координации и критически важные для безопасности зоны исполнения.

WVLA 2.0: путь интеграции моделей и гармонии программно-аппаратных средств

Технический подход WVLA 2.0 от Yushu демонстрирует явное расхождение с мейнстримом отрасли.

Большинство аналогичных решений делают ставку на чистое VLA (Vision-Language-Action) сквозное генерирование, в то время как WVLA 2.0 объединяет предсказательную способность модели WMA (World-Model Action) с генерацией действий VLA, обеспечивая полное обновление в понимании задач высокого уровня, семантическом рассуждении в 2D/3D пространстве, генерации действий с учетом динамических ограничений и устойчивости к помехам.

На уровне восприятия система объединяет четыре параллельных потока: камера глубины RealSense, лидар Livox MID360 и две боковые камеры, формируя 360-градусное пространственное представление с задержкой обновления позиции в условиях помех менее 10 мс. В плане программно-аппаратной координации параметры действий после вывода передаются через шину CAN на 23 степени свободы суставов G1. Благодаря собственному модулю управления движением «мозжечок» Yushu, точность позиционирования при захвате объекта весом менее 2 кг одной рукой может быть менее 5 мм.

В вычислительной архитектуре WVLA 2.0 сжимает периферийные вычисления до менее 100 TOPS, полностью работая на NVIDIA Jetson Orin NX (NVDA US, без рейтинга) в G1 EDU, без зависимости от облака. Руководство заявляет, что такая конструкция избегает риска прерывания задач из-за задержек в сети или потери связи.

Сдвиг парадигмы данных: «сбор данных без тела» становится мейнстримом

Изменение модели сбора данных — еще один важный сигнал в этом отчете.

Демонстрация Yushu показывает: при однократной записи без вмешательства дистанционного управления G1 может самостоятельно выполнять несколько последовательных задач в условиях помех. Это означает, что «сбор данных без тела» становится основной парадигмой производства данных для воплощенного интеллекта, то есть робот накапливает данные, полагаясь на собственное восприятие и принятие решений, а не на ручную разметку при дистанционном управлении.

Отраслевые исследования Nomura также указывают на текущие ограничения: система все еще имеет слепые зоны и недостаток обратного восприятия, скорость выполнения медленная, точность тонких операций недостаточна, и отсутствуют количественные бенчмарки для оценки непрерывного уровня успешности. Эти недостатки также определяют приоритетные границы для ближайшего коммерческого внедрения.

Руководство разработало поэтапный план внедрения: промышленное производство (сборка серводвигателей, загрузка/выгрузка, обработка оснастки) рассматривается как первый этап, так как собственные заводы Yushu обеспечивают замкнутый цикл данных; затем следуют логистическая сортировка и гибкая сборка в электронике 3C; сценарии дома и медицинского ухода считаются более отдаленной целью из-за значительно большей сложности открытой неструктурированной среды.

Полная стековая интеграция: два измерения дифференциации Yushu

Основной вывод отчета Nomura можно свести к одному суждению: в процессе коммерциализации воплощенного интеллекта возможности модели важны, но не являются единственным определяющим фактором.

Руководство Yushu определяет дифференцирующую конкурентоспособность компании на двух уровнях: первый — это способность к полной стековой самостоятельной интеграции от восприятия до модели и управления движением; второй — это накопление крупномасштабных реальных данных о работе от глобального парка роботов. Эти два актива взаимно усиливаются: собственное оборудование создает эксклюзивные данные, данные питают итерацию модели, образуя замкнутый круг, в который поставщикам облачных моделей трудно вмешаться.

С точки зрения конкурентной среды, логика внедрения фреймворка NeuralAxis и WVLA 2.0 указывает на один и тот же вывод: основное поле битвы воплощенного интеллекта разворачивается одновременно на уровне системной архитектуры и уровне данных. Для инвесторов измерение участников на трассе должно быть расширено с единственного «возможности модели» до более полной способности к системной интеграции и масштаба накопленных реальных данных.


Вышеуказанный контент предоставлен торговой платформой ZHUIFENG.

Для получения более детальных интерпретаций, включая оперативные комментарии и исследования первого уровня, присоединяйтесь к [**Годовому членству ZHUIFENG Trading Desk**]

![](https://img-cdn.gateio.im/social/moments-f187f887a1-07b7e18c28-8b7abd-62a40f)

Предупреждение о рисках и отказ от ответственности

          

            Рынок сопряжен с рисками, инвестиции требуют осторожности. Данная статья не является индивидуальной инвестиционной рекомендацией и не учитывает конкретные инвестиционные цели, финансовое положение или потребности отдельных пользователей. Пользователи должны учитывать, соответствуют ли любые мнения, точки зрения или выводы в данной статье их конкретным обстоятельствам. Инвестиции на основе данной статьи осуществляются на свой страх и риск.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
TradFiCFDGoldMaster
2,21M Популярность
#
SaylorHintsAtMoreBTC
8,5M Популярность
#
IsraelStrikesIranBTCPlunges
66,32K Популярность
#
PredictWorldCupShare20000U
528,85K Популярность
#
SolanaEcosystemANSEMSurges
22,01M Популярность

Закреплено

Карта сайта

Юйшу подтверждает новый тренд: основное поле битвы воплощённого интеллекта — не только модели.

NeuralAxis: переопределение системной архитектуры физического ИИ

WVLA 2.0: путь интеграции моделей и гармонии программно-аппаратных средств

Сдвиг парадигмы данных: «сбор данных без тела» становится мейнстримом

Полная стековая интеграция: два измерения дифференциации Yushu

Популярные темы

TradFiCFDGoldMaster

SaylorHintsAtMoreBTC

IsraelStrikesIranBTCPlunges

PredictWorldCupShare20000U

SolanaEcosystemANSEMSurges

Закреплено