Doanh nghiệp AI, từ "mua nhiều GPU hơn" chuyển sang "tối ưu hóa cấu hình giảm thiểu chi phí suy luận"… Giải pháp của AMD và Red Hat nhận được nhiều sự chú ý

robot
Đang tạo bản tóm tắt

Doanh nghiệp đang bước qua một ngưỡng mới trong việc ứng dụng trí tuệ nhân tạo. Hiện nay, sự chú ý của thị trường không còn giới hạn ở việc đầu tư vào AI hay không, mà chuyển sang cách triển khai phần cứng bán dẫn và hạ tầng phù hợp cho các hoạt động kinh doanh khác nhau nhằm tối đa hóa hiệu quả chi phí. Đặc biệt, với sự gia tăng nhanh chóng của các nhiệm vụ “AI đại lý” và chi phí suy luận tăng cao, các doanh nghiệp lớn không còn xem việc chọn thiết bị có hiệu năng cao nhất là ưu tiên hàng đầu, mà là lựa chọn tài nguyên tính toán phù hợp dựa trên mục tiêu, tức là thực hiện “lựa chọn”.

Trong bối cảnh thay đổi này, sự hợp tác giữa AMD và Red Hat lại thu hút sự chú ý. Phó Tổng Giám đốc Kinh doanh Công nghệ Doanh nghiệp Toàn cầu của AMD, John Hampton, đã chỉ ra tại “Hội nghị Red Hat 2026” tổ chức tại Boston rằng các doanh nghiệp mong muốn có hạ tầng AI linh hoạt hơn trong môi trường hỗn hợp tổng thể. Ông đề cập rằng, gần đây nhiều khách hàng đã vội vàng xây dựng các cụm GPU quy mô lớn để đáp ứng nhu cầu AI, nhưng trong giai đoạn vận hành thực tế lại phải đối mặt với áp lực chi phí vượt xa dự kiến.

Chi phí suy luận AI tăng vọt… doanh nghiệp xem xét lại chiến lược GPU đơn lẻ quy mô lớn

Theo ông Hampton, nhiều doanh nghiệp đã tập trung mua sắm GPU hiệu năng cao quy mô lớn để không bị tụt lại trong cuộc đua AI ban đầu. Vấn đề là, khi quy mô dịch vụ mở rộng, chi phí cho mỗi truy vấn AI liên tiếp tích tụ, nhanh chóng gia tăng áp lực ngân sách. Hiện tượng này được gọi là “Kinh tế Token”, ý chỉ rằng khi lượng sử dụng AI sinh dạng tăng, chi phí xử lý token cũng tăng theo, ảnh hưởng trực tiếp đến khả năng sinh lời của doanh nghiệp.

Ông nói: “Các doanh nghiệp ban đầu đã mua sắm hàng loạt GPU quy mô lớn để cạnh tranh AI, nhưng giờ đây đã xuất hiện phản ứng khó kiểm soát. Dù ứng dụng AI đang tăng trưởng, nhưng sự tăng nhanh của chi phí đã gây ra những lo ngại lớn.” Điều này cuối cùng đồng nghĩa với việc chiến lược AI của doanh nghiệp đang chuyển từ “đảm bảo thiết bị hiệu năng cao nhất” sang “tối ưu hóa triển khai theo nhiệm vụ”.

AMD và Red Hat: cung cấp giải pháp “toàn phổ” từ CPU đến GPU

Để đối phó với xu hướng này, AMD đã giới thiệu bộ sản phẩm “toàn phổ” bao gồm CPU, GPU hiệu năng cao với giá cả hợp lý và bộ tăng tốc hiệu suất cao. Chiến lược của họ là kết hợp các phần cứng này với stack phần mềm mã nguồn mở của Red Hat, hỗ trợ doanh nghiệp vận hành các nhiệm vụ AI linh hoạt trong môi trường đám mây hỗn hợp mà không phụ thuộc vào nhà cung cấp cụ thể nào.

Lấy ví dụ, AMD Instinct MI350P, được giới thiệu là GPU dựa trên giao diện PCIe, dễ dàng tích hợp vào các máy chủ hiện có. Đặc điểm nổi bật là thiết kế làm mát bằng gió để nâng cao hiệu quả chi phí. Red Hat AI đóng vai trò nền tảng doanh nghiệp, hỗ trợ triển khai và mở rộng các tác vụ AI đại lý trên phần cứng này. Ngoài ra, việc sử dụng CPU AMD EPYC và công cụ ảo hóa của Red Hat còn giúp hợp nhất máy chủ, giảm diện tích và tiêu thụ điện năng của trung tâm dữ liệu.

Chủ đề cốt lõi là “kiến trúc mở”… thúc đẩy đồng thời kiểm soát ngân sách AI và hiện đại hóa hạ tầng

Thông điệp chính của lần này là “tính mở” và “tính lựa chọn”. AMD cùng Red Hat nhấn mạnh rằng, so với hệ sinh thái đóng, doanh nghiệp nên dựa vào kiến trúc mở để có thể lựa chọn tài nguyên phù hợp nhất cho các nhiệm vụ AI khác nhau, từ CPU, GPU tiêu thụ ít năng lượng đến bộ tăng tốc hiệu suất cao. Không phải tất cả các nhiệm vụ suy luận đều cần triển khai trên thiết bị đắt tiền.

Phương pháp này không chỉ giúp giảm chi phí. Đối với doanh nghiệp, họ có thể tận dụng tối đa hạ tầng hiện có mà không làm chậm quá trình đưa AI vào hoạt động, đồng thời có thể tái phân bổ ngân sách và nguồn điện tiết kiệm được để đầu tư vào các dự án AI mới. Điều này mang ý nghĩa thực tiễn lớn, giúp hiện đại hóa hạ tầng AI và kiểm soát ngân sách cùng lúc.

Hampton dự đoán rằng, tiêu chuẩn đánh giá thị trường AI trong tương lai có thể sẽ không còn là “đã mua gì”, mà là “đã triển khai như thế nào”. Khi các doanh nghiệp bước vào giai đoạn vận hành chính thức của cạnh tranh AI, một số phân tích cho rằng, chiến thắng hay thua cuộc trong tương lai sẽ không còn dựa vào hiệu năng, mà là khả năng cân bằng tinh tế giữa tổng chi phí sở hữu và hiệu quả thực tế.

Lưu ý về AI TP Bài viết này dựa trên mô hình ngôn ngữ của TokenPost.ai để tóm tắt. Thông tin chính trong bài có thể bị bỏ sót hoặc có sự khác biệt với thực tế.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim