A Google Cloud lança uma arquitetura de referência de conexão privada para aplicações RAG

robot
Geração de resumo em curso

Notícias ME, 5 de abril (UTC+8), a Google Cloud publicou recentemente um artigo técnico que apresenta uma arquitetura de referência privada, concebida especificamente para aplicações de IA generativa com capacidades de geração com recuperação aumentada (RAG). Esta arquitetura é adequada para cenários em que a comunicação do sistema deve utilizar endereços IP privados e não pode passar pela internet pública. O seu design segue um modelo regional, incluindo uma rede externa e o ambiente da Google Cloud, que é composto por um projeto de roteamento, um projeto de host de VPC partilhada e três projetos de serviços dedicados. A arquitetura integra serviços-chave como Cloud Interconnect/Cloud VPN, Network Connectivity Center, Cloud Router, Private Service Connect, VPC partilhada, Cloud Armor, Application Load Balancer e VPC Service Controls. O artigo descreve, em detalhe, três caminhos principais de tráfego: o fluxo de preenchimento de dados RAG, o fluxo de inferência e o fluxo de gestão e roteamento, com o objetivo de fornecer às empresas uma infraestrutura segura e fiável para cargas de trabalho de IA, através de ligações privadas fim a fim e de controlo de segurança em camadas. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar