Google Cloud опубликовала эталонную архитектуру приватных соединений для приложений RAG

robot
Генерация тезисов в процессе

ME News: сообщение, 5 апреля (UTC+8). Google Cloud недавно опубликовал техническую статью, в которой представлена частная эталонная архитектура для приложений генеративного ИИ, специально предназначенная для возможностей Retrieval-Augmented Generation (RAG). Эта архитектура подходит для сценариев, где системная связь должна использовать частные IP-адреса и не может проходить через общедоступный интернет. Ее конструкция использует региональный режим и включает внешнюю сеть и среду Google Cloud, которая состоит из проекта маршрутизации, проекта хостов Shared VPC и трех проектов выделенных сервисов. В архитектуру интегрированы ключевые сервисы, такие как Cloud Interconnect/Cloud VPN, Network Connectivity Center, Cloud Router, Private Service Connect, Shared VPC, Cloud Armor, Application Load Balancer и VPC Service Controls. В статье подробно описаны три основные траектории трафика: поток заполнения данных для RAG, поток вывода (инференса) и поток управления и маршрутизации. Цель — обеспечить для корпоративных AI-нагрузок безопасную и надежную инфраструктуру за счет сквозного частного подключения и многоуровневого контроля безопасности. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$2.28KДержатели:1
    0.09%
  • РК:$2.24KДержатели:1
    0.00%
  • РК:$2.26KДержатели:2
    0.00%
  • РК:$2.24KДержатели:1
    0.00%
  • РК:$2.24KДержатели:1
    0.00%
  • Закрепить