Google Cloud công bố kiến trúc tham khảo kết nối riêng dành cho ứng dụng RAG

robot
Đang tạo bản tóm tắt

Tin tức ME: Thông báo, vào ngày 5 tháng 4 (UTC+8), Google Cloud gần đây đã phát hành một bài viết kỹ thuật, giới thiệu một kiến trúc tham chiếu kết nối riêng được thiết kế riêng cho các ứng dụng AI tạo sinh có khả năng tạo truy vấn dựa trên tăng cường truy xuất (RAG). Kiến trúc này phù hợp với các tình huống mà hệ thống liên lạc phải sử dụng địa chỉ IP riêng và không thể đi qua Internet công cộng. Thiết kế của nó áp dụng mô hình theo vùng, bao gồm mạng bên ngoài và môi trường của Google Cloud, trong đó môi trường này được tạo thành từ một dự án định tuyến, một dự án host Shared VPC và ba dự án dịch vụ chuyên dụng. Kiến trúc tích hợp các dịch vụ quan trọng như Cloud Interconnect/Cloud VPN, Network Connectivity Center, Cloud Router, Private Service Connect, Shared VPC, Cloud Armor, Application Load Balancer và VPC Service Controls. Bài viết mô tả chi tiết ba luồng đường đi lưu lượng cốt lõi: luồng nạp dữ liệu cho RAG, luồng suy luận và luồng quản lý & định tuyến, nhằm cung cấp hạ tầng an toàn và đáng tin cậy cho các khối công việc AI của doanh nghiệp thông qua kết nối riêng đầu-cuối và các cơ chế kiểm soát bảo mật theo lớp. (Nguồn: InFoQ)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim