Google, mở rộng triển khai Gemini tại chỗ... Mâu thuẫn giữa "quyền kiểm soát vs hiệu suất" trong hạ tầng AI doanh nghiệp có thể được giải quyết không

robot
Đang tạo bản tóm tắt

html

Vượt qua AI tạo sinh, thời đại của “AI đại lý” có khả năng tự thực hiện nhiệm vụ đã đến, tiêu chuẩn thiết kế hạ tầng doanh nghiệp cũng đang thay đổi nhanh chóng. Đặc biệt là trong ngành quản lý, các cơ quan chính phủ và các doanh nghiệp có yêu cầu cao về chủ quyền dữ liệu, đang yêu cầu một hạ tầng “sẵn sàng AI” để có thể vận hành các mô hình AI mới nhất trong môi trường nội bộ mà không cần truyền dữ liệu nhạy cảm ra bên ngoài.

Để đáp ứng các nhu cầu này, Google đang mở rộng chiến lược hạ tầng của mình, cho phép doanh nghiệp sử dụng các mô hình AI của riêng họ và công nghệ đám mây ngay trong môi trường cục bộ. Phó chủ tịch kiêm Tổng giám đốc bộ phận mạng và an ninh của Google, Muninder Sambi, tại sự kiện Google Cloud Next gần đây đã nói: “Doanh nghiệp luôn phải đối mặt với lựa chọn tuân thủ chủ quyền và quy định hoặc từ bỏ các nguyên tắc này để chuyển sang đám mây. Đám mây phân tán của Google chính là giải pháp mang Gemini và khả năng AI của Google vào môi trường nội bộ.”

Gemini hợp tác với NVIDIA, Dell, mở rộng ra mạng nội bộ

Google hợp tác với NVIDIA ($NVDA) và Dell Technologies ($DELL), hỗ trợ vận hành các mô hình dựa trên Gemini trong các môi trường cách ly khỏi mạng công cộng và môi trường nội bộ có kết nối mạng. Đặc biệt, mô hình Gemini Flash hiện đã hỗ trợ triển khai cục bộ dựa trên GPU Blackwell B200 và B300 của NVIDIA. Đối với doanh nghiệp, điều này có nghĩa là có thể vận hành các tải công việc “AI chủ quyền” mà không làm rò rỉ dữ liệu.

Phó chủ tịch Sambi nhấn mạnh, đây không chỉ đơn thuần cung cấp một “nhà máy AI”, mà còn cung cấp một “động cơ AI” giúp doanh nghiệp xây dựng hệ thống sản xuất AI của riêng mình. Đối với các lĩnh vực tài chính, y tế, quốc phòng và công cộng gặp khó khăn khi sử dụng đám mây, đây chắc chắn là một sự thay đổi đáng chú ý.

Kubernetes nổi lên như hệ điều hành thực chất của thời đại AI

Cùng với sự mở rộng của hạ tầng AI nội bộ, vai trò của Kubernetes ngày càng trở nên quan trọng. Giám đốc sản phẩm cao cấp của Google Kubernetes và Google Compute Engine, Drew Bradstock, nhận định rằng Kubernetes hiện đang đóng vai trò như một “hệ điều hành” cho các nhiệm vụ AI bao gồm huấn luyện, suy luận và học tăng cường.

Ông giải thích rằng, trong giai đoạn phổ biến các mô hình ngôn ngữ lớn, chưa rõ Kubernetes có thể trở thành trung tâm kiểm soát AI hay không, nhưng với sự phát triển nhanh của hệ sinh thái mã nguồn mở hướng tới AI, nó đã trở thành nền tảng để vận hành代理 trong môi trường lai. Trong bối cảnh các doanh nghiệp muốn triển khai dịch vụ AI trên nhiều môi trường khác nhau, lợi ích của tiêu chuẩn hóa của Kubernetes lại càng rõ ràng hơn.

Hiện nay, người dùng không chỉ giới hạn ở con người

Sự lan rộng của AI đại lý không chỉ thay đổi cách vận hành hạ tầng, mà còn thay đổi triết lý thiết kế sản phẩm. Giám đốc Bradstock chỉ ra rằng, trung tâm trải nghiệm nhà phát triển hiện không nhất thiết phải là con người. Khi AI đại lý thay thế đáng kể việc viết mã và vận hành, các tài liệu, giao diện và thậm chí công cụ đều bắt đầu được thiết kế lại thành cấu trúc dễ cho AI đại lý đọc và sử dụng.

Ông nói: “DevOps mới đang sử dụng Claude và Gemini để xử lý công việc”, và chỉ ra rằng môi trường người dùng, tài liệu và các loại công cụ đều đang được tổ chức lại xung quanh “kỹ năng”. Điều này ngụ ý rằng, trong tương lai, phần mềm doanh nghiệp có thể vượt ra ngoài UI dành cho con người, phát triển thành cấu trúc cho phép AI đại lý gọi trực tiếp và thực thi.

Mục tiêu cốt lõi: đồng thời đạt được “duy trì kiểm soát” và “đảm bảo hiệu năng”

Điều cốt lõi của sự thay đổi này là, các doanh nghiệp không còn muốn phải chọn giữa quyền kiểm soát dữ liệu và hiệu năng AI. Hạ tầng AI sẵn sàng ngày nay không chỉ đơn thuần mở rộng máy chủ, mà còn chuyển đổi thành một thiết kế tổng hợp tích hợp quyền chủ quyền dữ liệu, tài nguyên GPU, triển khai mô hình, quản trị và điều phối.

Xét về thị trường, chiến lược của Google cho thấy các đám mây doanh nghiệp đang một lần nữa đầu tư sâu vào nội bộ và các lĩnh vực lai. Khi quá trình doanh nghiệp triển khai AI chính thức bắt đầu, yếu tố quyết định không chỉ là hiệu năng của mô hình, mà còn là khả năng triển khai trong môi trường vận hành thực tế, đảm bảo an toàn và linh hoạt.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim