Google Cloud опубликовала эталонную архитектуру приватных соединений для приложений RAG

robot
Генерация тезисов в процессе

Новости ME, 5 апреля (UTC+8), Google Cloud недавно опубликовала техническую статью, в которой представила эталонную архитектуру частного подключения для разрабатываемых с учетом возможностей генеративного ИИ приложений с функцией извлечения с усилением (RAG). Эта архитектура подходит для сценариев, где системная связь должна использовать частные IP-адреса и не может проходить через публичный интернет. В ее основе лежит региональная модель: она включает внешнюю сеть и среду Google Cloud, которая, в свою очередь, состоит из проекта маршрутизатора, проекта хостинга общего VPC и трех проектов для выделенных сервисов. Архитектура интегрирует ключевые сервисы, включая Cloud Interconnect/Cloud VPN, Network Connectivity Center, Cloud Router, Private Service Connect, Shared VPC, Cloud Armor, Application Load Balancer и VPC Service Controls. В статье подробно описаны три основные траектории трафика: поток заполнения RAG-данных, поток вывода и поток управления и маршрутизации, и цель заключается в том, чтобы обеспечить безопасную и надежную инфраструктуру для корпоративных AI-нагрузок за счет сквозного частного подключения и многоуровневого контроля безопасности. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить