Mũ đỏ, đặt tiêu chuẩn về niềm tin và suy luận lên hàng đầu trong bối cảnh lan truyền của “AI dạng đại lý”… đặt cược vào vLLM

robot
Đang tạo bản tóm tắt

Khi các doanh nghiệp đưa “AI đại lý” vào công việc thực tế, sự chú ý đang chuyển từ hiệu suất mô hình sang “độ tin cậy”. Phân tích chỉ ra rằng, do AI có khả năng viết mã, tiếp cận hệ thống thậm chí thực hiện các thao tác thực chất, cách đảm bảo an toàn, quản trị và ổn định đã trở thành vấn đề cốt lõi.

Giám đốc công nghệ (CTO) của Red Hat và Phó Chủ tịch cao cấp phụ trách kỹ thuật toàn cầu Chris Wright phát biểu tại Hội nghị Red Hat 2026: “Khi chúng ta muốn để đại lý hành động trong kinh doanh thực tế, việc tin tưởng AI này trở nên vô cùng quan trọng.” Ông đặc biệt nhấn mạnh rằng, cấp quyền tối thiểu, môi trường sandbox và hệ thống quản lý đại lý quy mô lớn là những điều kiện cần thiết.

Red Hat đặt cược xây dựng “tầng suy luận tiêu chuẩn” dựa trên vLLM

Như một giải pháp giảm độ phức tạp của AI doanh nghiệp, Red Hat đề xuất “tầng suy luận tiêu chuẩn”. Ý tưởng là, giống như Linux và Kubernetes trong quá khứ đã trở thành nền tảng chung của ngành, nay engine suy luận mã nguồn mở vLLM cũng nên đảm nhận vai trò này.

Để thực hiện điều đó, Red Hat đã mua lại Neural Magic để có khả năng tối ưu hiệu suất lượng tử và suy luận. Chris Wright giải thích: “Các nhà cung cấp mô hình thậm chí đã bắt đầu phát triển cho vLLM trước khi các mô hình mở rộng ra công chúng. Sự tiêu chuẩn hóa này đang nâng cao hiệu quả của toàn bộ hệ sinh thái, đồng thời trở thành nền tảng nâng cao hiệu quả vận hành nội bộ doanh nghiệp.”

Xét từ góc độ doanh nghiệp, điều này có ý nghĩa quan trọng vì nó giảm thiểu sự không chắc chắn trong lựa chọn hạ tầng. Chỉ khi xác định rõ nền tảng nào để chạy mô hình, mới có thể giảm chi phí phát triển, triển khai và bảo trì. Cuối cùng, độ tin cậy của AI mã nguồn mở không chỉ liên quan đến đạo đức công nghệ mà còn gắn chặt với “khả năng dự đoán” trong môi trường vận hành thực tế.

Chi phí suy luận, nay đã trở thành biến số vận hành được hội đồng quản trị quan tâm

Cùng với sự phổ biến của AI, “chi phí suy luận” cũng trở thành chỉ số vận hành quan trọng. Do chi phí điện năng và bán dẫn cần thiết để vận hành các mô hình ngôn ngữ lớn liên tục tăng, các doanh nghiệp đang chuyển từ việc sử dụng mô hình mạnh nhất sang tìm kiếm tổ hợp hiệu quả nhất cho từng lĩnh vực.

Chris Wright cho biết, cần lựa chọn phần cứng và mô hình tối ưu về mặt chi phí và hiệu quả năng lượng phù hợp với nhiệm vụ cụ thể. Nói cách khác, áp dụng cùng một AI cho mọi công việc có thể không hiệu quả. Các nhiệm vụ đơn giản có thể phù hợp hơn với mô hình nhỏ, trong khi các quyết định phức tạp cần mô hình lớn hơn.

Xu hướng này làm tăng khả năng hạ tầng AI chuyển sang “kiến trúc dị hợp” thay vì “kiến trúc đơn nhất”. Bởi vì các môi trường như đám mây, triển khai tại chỗ và tại các nhà máy, các môi trường biên như edge sẽ được kết hợp sử dụng, phần cứng cũng có thể mở rộng từ GPU đơn sang nhiều tổ hợp khác nhau. Tại thời điểm này, Red Hat kỳ vọng chiến lược nền tảng của họ sẽ duy trì giá trị dài hạn.

Cuộc chiến “AI đáng tin cậy” đang lan rộng đến các doanh nghiệp nền tảng

Phát biểu này cho thấy, cạnh tranh trong thị trường AI không còn chỉ dựa vào hiệu suất mô hình nữa. Khách hàng doanh nghiệp thực sự cần không phải là một mô hình thông minh hơn, mà là một môi trường thực thi đáng tin cậy và có thể kiểm soát.

Đặc biệt trong môi trường có hàng trăm, hàng nghìn đại lý AI cùng hoạt động, các yếu tố như chiến lược an ninh, quản lý quyền hạn, khả năng kiểm tra audit trở nên không thể thiếu. Đây cũng là lý do ngành công nghiệp, giống như thời kỳ Linux và Kubernetes, lại tìm kiếm các tiêu chuẩn chung một lần nữa.

Cuối cùng, độ tin cậy của AI mã nguồn mở có thể trở thành điều kiện then chốt quyết định tốc độ phổ biến của AI doanh nghiệp trong tương lai. Với việc xác lập tầng suy luận tiêu chuẩn và chiến lược hạ tầng dị hợp, các doanh nghiệp hy vọng sẽ đẩy nhanh quá trình đưa AI từ giai đoạn thử nghiệm sang môi trường sản xuất thực tế.

TP AI Lưu ý: Bài viết này dựa trên tóm tắt từ mô hình ngôn ngữ TokenPost.ai. Nội dung chính có thể bị bỏ qua hoặc không chính xác.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • 1
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim