A Google Cloud lança uma arquitetura de referência de ligação privada para aplicações RAG

robot
Geração de resumo em curso

Notícias ME, mensagem a 5 de abril (UTC+8): a Google Cloud publicou recentemente um artigo técnico que apresenta uma arquitectura de referência de ligação privada para aplicações de IA generativa concebidas especificamente para capacidades de geração aumentada por pesquisa (RAG). Esta arquitectura é adequada para cenários em que a comunicação do sistema tem de utilizar endereços IP privados e não pode passar pela Internet pública. O seu desenho segue um modelo regional, incluindo uma rede externa e o ambiente da Google Cloud, que é composto por um projecto de routing, um projecto host de Shared VPC e três projectos dedicados a serviços. A arquitectura integra serviços essenciais como Cloud Interconnect/Cloud VPN, Network Connectivity Center, Cloud Router, Private Service Connect, Shared VPC, Cloud Armor, Application Load Balancer e VPC Service Controls. O artigo descreve em detalhe três trajectórias principais do tráfego: o fluxo de preenchimento de dados de RAG, o fluxo de inferência e o fluxo de gestão e routing, com o objectivo de proporcionar uma base de infra-estrutura segura e fiável para cargas de trabalho de IA empresariais, através de ligações privadas ponta a ponta e de controlos de segurança em camadas. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar