Google Cloud опубликовала эталонную архитектуру приватных соединений для приложений RAG

robot
Генерация тезисов в процессе

Новости ME, сообщение от 5 апреля (UTC+8): в последнее время Google Cloud опубликовала техническую статью, в которой описывается эталонная частная архитектура подключения, предназначенная для проектирования приложений генеративного ИИ с возможностями Retrieval Augmented Generation (RAG). Эта архитектура подходит для сценариев, где системная связь должна использовать частные IP-адреса и не может проходить через общедоступный интернет. В своей конструкции она использует региональный режим и включает внешнюю сеть и среду Google Cloud, которая состоит из проекта маршрутизатора, проекта хостов Shared VPC и трех проектов для выделенных сервисов. Архитектура интегрирует такие ключевые сервисы, как Cloud Interconnect/Cloud VPN, Network Connectivity Center, Cloud Router, Private Service Connect, Shared VPC, Cloud Armor, Application Load Balancer и VPC Service Controls. В статье подробно описаны три основные траектории трафика: поток заполнения данных RAG, поток вывода (inference) и поток управления и маршрутизации; цель — обеспечить безопасную и надежную инфраструктуру для корпоративных ИИ-нагрузок за счет сквозного частного подключения и многоуровневого контроля безопасности. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить