Omdia: O mercado global de sensores de imagem para robôs industriais deverá atingir aproximadamente 200 milhões de dólares em 2025

robot
Geração de resumo em curso

Investir na bolsa depende dos relatórios de análise do Kylin Golden Phoenix, autoritativos, profissionais, oportunos, abrangentes, ajudando-o a descobrir oportunidades de temas potenciais!

(Fonte: Zhitong Finance)

A Zhitong Finance APP soube que o mercado global de sensores está a crescer de forma estável impulsionado pela condução de veículos autónomos e inteligência artificial. Segundo a Omdia, até 2025, o mercado global de sensores de imagem para robôs industriais terá um valor de cerca de 200 milhões de dólares, prevendo-se que atinja quase 380 milhões de dólares em 2029, com uma taxa de crescimento anual composta de quase 14%, refletindo o aceleramento do processo de digitalização global. Com a produção em massa de robôs humanoides e a diversificação dos cenários de aplicação, a tecnologia de perceção visual dos robôs fará avanços significativos, evoluindo rapidamente para uma direção tridimensional, automatizada, multimodal e integrada de processamento sensorial.

Visão 3D

Robôs industriais tradicionais apenas precisam de realizar tarefas repetitivas em posições fixas, enquanto robôs inteligentes com corpo precisam de integrar ambientes dinâmicos complexos, surgindo assim a perceção visual ativa(Percepção Visual Ativa). Isto refere-se à capacidade do sistema de ajustar proativamente o seu comportamento ou otimizar parâmetros ambientais com base no cenário específico, incluindo a movimentação da posição e ângulo do sensor, ajustando dinamicamente os parâmetros do sensor conforme a tarefa. Isto exige que os sensores visuais tenham uma compreensão mais profunda do espaço 3D e do ambiente dinâmico. Os sistemas de visão 2D com câmaras RGB monocromáticas ou multiespectrais estão a evoluir para sistemas de visão 3D. Sensores de visão 3D como ToF, luz estruturada, câmaras estereoscópicas e LiDAR de médio e longo alcance, que podem emitir energia ao ambiente e receber ecos, têm um amplo espaço de aplicação. A visão 3D apresenta uma diversificação de desenvolvimento. Diferentes abordagens tecnológicas focam em precisão, alcance de deteção, custo e consumo de energia, coexistindo por longos períodos em diferentes cenários de aplicação.

Fusão de perceção multimodal

Sensores de modo único têm limitações inerentes, como câmaras de luz visível que falham em baixa luminosidade, ou radares que não reconhecem texturas. A fusão de múltiplos sensores combina as vantagens de diferentes sensores para uma compreensão mais completa do ambiente. Modelos básicos de inteligência com corpo(como o modelo VLA) exigem que os sensores visuais se integrem profundamente com linguagem, tato, audição e outros modos, permitindo que os robôs compreendam melhor o ambiente ao seu redor e interajam com ele. Por exemplo, sensores táteis baseados em visão(Tato-Visual) estão a tornar-se uma tecnologia-chave para mãos robóticas ágeis. Embalagens de sistema(SiP) podem integrar compactamente vários sensores e componentes de processamento num único módulo, evoluindo para sistemas mais leves e adaptáveis.

Imagens infravermelhas e perceção multiespectral

A falha de câmaras de luz visível em condições de noite, nevoeiro, fumaça levou à ampla aplicação da tecnologia de imagem infravermelha. Sensores infravermelhos emitem e recebem luz infravermelha, medindo o tempo de reflexão, permitindo identificar obstáculos a 3-10 metros com precisão, possibilitando navegação autónoma e evitamento de obstáculos em ambientes escuros. Com diferentes objetos refletindo a luz infravermelha de forma distinta, robôs industriais podem usar sensores infravermelhos para classificar rapidamente objetos durante tarefas de reconhecimento e separação. A tecnologia de imagem térmica infravermelha pode detectar radiação infravermelha emitida pelos próprios objetos, sendo usada em patrulhas noturnas, detecção de sobreaquecimento de equipamentos elétricos, monitorização de sinais vitais, entre outros, tornando-se uma peça-chave na construção de materiais de perceção.

A deteção multiespectral combina sensores de luz visível(400–700 nm), infravermelho próximo(940 nm), infravermelho médio(5.5–14.0 μm) e ultravioleta(390 nm) num mesmo módulo, permitindo que os robôs obtenham múltiplas informações físicas numa única interação, interpretando de forma abrangente a forma, cor e temperatura dos objetos.

Sensores de evento

Sensores visuais tradicionais baseados em quadros, devido à limitação de taxa de quadros fixa, frequentemente enfrentam problemas de desfocagem de movimento e perda de alvo ao seguir objetos em alta velocidade. Sensores de evento(Event based sensor) simulam as características da visão humana, respondendo apenas às mudanças de luminosidade ou contraste na cena visual. Estes sensores são ideais para perceção de informação em tempo real e de alta eficiência, eliminando o desfocagem ao seguir objetos rápidos e sendo eficazes na perceção de objetos em alta gama dinâmica, além de consumirem menos dados, sendo mais adequados para plataformas de computação de borda em robôs móveis. Atualmente, estes sensores geralmente trabalham em conjunto com sensores RGB, podendo fornecer dados de cor e eventos simultaneamente, oferecendo uma solução integrada para tarefas visuais de alta velocidade.

Perceção e cálculo integrados

À medida que os cenários de aplicação de inteligência com corpo se tornam mais complexos, há uma maior exigência de tempo real, baixo consumo de energia e alta integração dos sistemas visuais. Sistemas visuais tradicionais separam sensores e processadores, transmitindo grandes volumes de dados para CPU ou GPU para processamento, o que é pesado para robôs móveis. Arquiteturas de perceção e cálculo integrados combinam sensores e unidades de processamento num único chip, realizando pré-processamento como extração de características e reconhecimento de objetos na fonte de dados, reduzindo significativamente a latência, o consumo de energia e protegendo a segurança e privacidade dos dados, facilitando a aplicação de inteligência com corpo em cenários sensíveis à privacidade. Atualmente, há duas abordagens de hardware de perceção e cálculo integrados: processamento próximo ao sensor(Near-sensor Computing) e processamento interno ao sensor(In-sensor Computing). Com o desenvolvimento de novas tecnologias de armazenamento, sistemas inteligentes de imagem integrados de perceção, armazenamento e cálculo tornam-se possíveis. Por exemplo, chips que integram detectores fotoelétricos(PD) e memórias resistivas(RRAM), criando uma nova paradigma de visão semelhante ao cérebro.

No futuro, além de avanços no hardware, será necessário aprofundar a fusão multimodal de dados a nível de algoritmos, estabelecendo um espaço de expressão multimodal unificado. Além disso, a otimização do ciclo fechado de perceção e ação a nível de sistema será crucial. Sistemas de inteligência com corpo capazes de perceção, compreensão e interação autônomas estão a caminhar passo a passo do ficção científica para a realidade.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar