Google Cloud опубликовала эталонную архитектуру приватных соединений для приложений RAG

robot
Генерация тезисов в процессе

Сообщение ME News: 5 апреля (UTC+8) компания Google Cloud недавно опубликовала техническую статью, в которой представлена референс-архитектура частного подключения для генеративных AI-приложений, специально предназначенных для функций Retrieval-Augmented Generation (RAG). Эта архитектура подходит для сценариев, где служебная коммуникация системы должна использовать частные IP-адреса и не может проходить через публичный Интернет. В ее конструкции используется региональная модель: она включает внешнюю сеть и среду Google Cloud, которая, в свою очередь, состоит из проекта маршрутизации, проекта хостов Shared VPC и трех выделенных сервисных проектов. В архитектуру интегрированы ключевые сервисы: Cloud Interconnect/Cloud VPN, Центр сетевого подключения, Cloud Router, Private Service Connect, Shared VPC, Cloud Armor, балансировщик нагрузки приложений и VPC Service Controls. В статье подробно описаны три ключевых пути прохождения трафика: поток заполнения RAG-данными, поток инференса и поток управления и маршрутизации. Цель — предоставить корпоративным AI-нагрузкам безопасную и надежную инфраструктуру за счет сквозного частного подключения и многоуровневого контроля безопасности. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить