NVIDIA NVIDIA Lança o Nemotron 3 Nano Omni para Avançar a IA Multimodal Unificada para Aplicações Empresariais

Resumidamente

A NVIDIA lança o Nemotron 3 Nano Omni, um modelo de IA multimodal aberto que unifica visão, fala e linguagem para impulsionar o desempenho, eficiência e implantação escalável de IA empresarial.

NVIDIA LNVIDIA Launches Nemotron 3 Nano Omni To Advance Unified Multimodal AI For Enterprise ApplicationsA empresa de tecnologia NVIDIA anunciou o lançamento do Nemotron 3 Nano Omni, um modelo de inteligência artificial multimodal aberto projetado para unificar capacidades de visão, fala e linguagem dentro de um único sistema. O modelo pretende permitir que agentes de IA processem e raciocinem através de múltiplos tipos de dados, incluindo vídeo, áudio, imagens, documentos e texto, enquanto oferecem respostas mais rápidas e eficientes.

De acordo com o anúncio, o modelo é posicionado como uma solução pronta para empresas, voltada a melhorar o desenvolvimento e a implantação de agentes de IA multimodais. É descrito como oferecendo alta precisão juntamente com custos operacionais reduzidos, além de proporcionar flexibilidade e controlo na implantação para desenvolvedores e organizações. O sistema alcançou, segundo relatos, desempenho líder em vários benchmarks relacionados à inteligência de documentos, bem como compreensão de áudio e vídeo.

A adoção pela indústria já começou entre várias empresas focadas em IA, com os primeiros utilizadores incluindo Aible, Applied Scientific Intelligence (ASI), Ekacare, H Company e Pyler. Organizações adicionais como Amdocs, Dell, DocuSign, Infosys, IQVIA, Oracle, Palantir Technologies, Quantiphi, Tata Consultancy Services e Zefr estão a avaliar o modelo para possível integração nos fluxos de trabalho empresariais.

Processamento de IA Multimodal para Melhorar Eficiência, Consciência de Contexto e Flexibilidade na Implantação Empresarial

Dentro de aplicações técnicas, o Nemotron 3 Nano Omni foi projetado para reduzir a fragmentação que normalmente ocorre quando modelos separados são usados para diferentes modalidades. Sistemas tradicionais frequentemente dependem de componentes distintos para processamento de visão, fala e linguagem, o que pode aumentar a latência, o custo e as inconsistências no raciocínio entre modalidades. Ao integrar codificação visual e de áudio numa única arquitetura baseada num design híbrido de especialistas mistos, o modelo pretende simplificar a inferência e melhorar o throughput.

O sistema também pretende funcionar como uma camada de perceção dentro de estruturas mais amplas de agentes, trabalhando ao lado de outros modelos da família Nemotron. Em aplicações práticas, pode suportar agentes de uso informático que interpretam interfaces gráficas de utilizador, sistemas de inteligência de documentos que analisam dados empresariais de formato misto, e ferramentas de raciocínio áudio-vídeo que mantêm a compreensão contextual através de múltiplos fluxos de entrada.

A arquitetura do modelo foi construída para lidar com entradas de alta resolução e processamento de contexto prolongado, permitindo uma interpretação mais detalhada de ambientes complexos, como gravações de tela ou análise de múltiplos documentos. Essa capacidade pretende melhorar o desempenho em tarefas que requerem consciência situacional contínua ao longo do tempo.

A NVIDIA lançou o Nemotron 3 Nano Omni como um modelo aberto, disponibilizando acesso aos pesos, conjuntos de dados e metodologias de treino. A empresa afirma que essa abordagem permite às organizações personalizar e implantar o sistema em diferentes ambientes, incluindo nuvem, infraestruturas locais e de borda, dependendo de requisitos regulatórios ou de governança de dados. O modelo está disponível através de múltiplos canais de distribuição, incluindo plataformas de desenvolvedores e ecossistemas de parceiros, apoiando a integração em pipelines de IA existentes.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar