Meta(META.US)ngừng phát triển chip cao cấp tự nghiên cứu Mở rộng hợp tác với Nvidia, AMD

robot
Đang tạo bản tóm tắt

Theo những người am hiểu rõ, Meta Platforms (META.US) đã gặp phải những thử thách trong quá trình phát triển chip AI nội bộ, và đã từ bỏ việc sử dụng các giải pháp chip tiên tiến nhất của mình, chuyển sang thiết kế các phiên bản đơn giản hơn. Tuần trước, do gặp khó khăn kỹ thuật trong quá trình thiết kế chip, công ty chính thức dừng dự án phát triển chip đào tạo mô hình AI tiên tiến nhất. Báo cáo cũng chỉ ra rằng, Meta đã cập nhật cho nhân viên bộ phận hạ tầng trí tuệ nhân tạo về kế hoạch điều chỉnh công nghệ này trong tuần trước.

Quyết định Meta từ bỏ tự phát triển chip tiết lộ những khó khăn chung mà các công ty gặp phải khi cố gắng thiết kế chip AI có thể cạnh tranh với ông lớn thị trường Nvidia (NVDA.US).

Việc điều chỉnh lộ trình chip của Meta lần này diễn ra sau khi công ty đạt được các hợp tác mới với AMD (AMD.US), Nvidia và Google (GOOGL.US) thuộc Alphabet. Theo đó, công ty đã ký các thỏa thuận trị giá hàng tỷ đô la để thuê chip AI của Google.

Vào đầu tuần này, AMD thông báo hợp tác với Meta để triển khai các chip AMD Instinct có công suất lên tới 6 gigawatt, nhằm cung cấp sức mạnh tính toán cho hạ tầng AI thế hệ tiếp theo của họ. Ngoài ra, Meta còn đạt thỏa thuận hợp tác chiến lược “đa thế hệ” với Nvidia, cam kết triển khai quy mô lớn các chip Nvidia trong các trung tâm dữ liệu của mình.

Chip AI do Meta tự phát triển thuộc dự án Meta Training and Inference Accelerator (MTIA). Mục tiêu chính của sáng kiến này là giảm chi phí vận hành dài hạn bằng cách tích hợp chặt chẽ khả năng thiết kế chip, đồng thời tăng cường khả năng tự chủ trong hạ tầng trung tâm dữ liệu.

Về vấn đề này, người phát ngôn của Meta khẳng định: “Chúng tôi liên tục đầu tư xây dựng danh mục cung ứng chip đa dạng để phù hợp với nhu cầu kinh doanh, trong đó việc thúc đẩy dòng sản phẩm MTIA là hướng chiến lược quan trọng. Trong năm nay, chúng tôi sẽ công bố thêm tiến trình nghiên cứu và phát triển cũng như kế hoạch triển khai của dòng sản phẩm này.”

Theo các báo cáo, Meta đã từ bỏ phiên bản thứ hai của chip đào tạo mang mã Iris, và dự án phát triển chip đào tạo tiên tiến hơn mang tên Olympus cũng đã bị dừng lại.

Một nhân viên nội bộ tham gia vào quá trình phát triển chip của Meta tiết lộ rằng, trong nội bộ công ty, có sự thận trọng chung về kế hoạch phát triển chip có thể cạnh tranh về hiệu năng với Nvidia, chủ yếu lo ngại về khả năng trì hoãn hoặc phải thiết kế lại dự án. Người này cho biết, các báo cáo liên quan cho thấy, việc phát triển loại chip này đòi hỏi phải thành lập một đội ngũ kỹ sư quy mô lớn để đảm nhiệm các công đoạn thiết kế, tinh chỉnh và kiểm soát tiêu thụ năng lượng. Nếu không thể giải quyết hiệu quả vấn đề tiêu thụ năng lượng, các chip tự phát triển này có thể không đủ giá trị để đưa vào sử dụng khi so sánh với các sản phẩm đã trưởng thành của Nvidia.

Chip đào tạo Iris sử dụng kiến trúc tính toán SIMD (Single Instruction Multiple Data). Kiến trúc này có mức độ khó thiết kế thấp hơn đối với kỹ sư phần cứng, nhưng lại đặt ra những thách thức lập trình đáng kể cho các kỹ sư phần mềm khi đào tạo mô hình AI. Theo báo cáo, Olympus sử dụng kiến trúc SIMD đa luồng (SIMT) cùng nguồn gốc với các chip AI của Nvidia — kiến trúc này dễ lập trình hơn cho kỹ sư phần mềm, nhưng đòi hỏi kỹ thuật cao hơn trong thiết kế phần cứng.

Kiến trúc SIMT do Nvidia thúc đẩy, với khả năng linh hoạt cao hơn và phù hợp hơn với yêu cầu đào tạo mô hình AI hiện đại, đã được nhiều công ty công nghệ lựa chọn. Ban đầu, Meta dự kiến hoàn thành thiết kế chip Olympus sớm nhất vào quý IV năm 2026. Tuy nhiên, các báo cáo bổ sung rằng, từ khi bắt đầu nghiên cứu sơ bộ đến khi sản xuất hàng loạt thường mất ít nhất chín tháng hoặc lâu hơn nữa, điều này có nghĩa là thời gian sản xuất thực tế có thể bị trì hoãn thêm nữa.

Bộ phận trung tâm của chip Olympus chịu trách nhiệm tính toán AI — GPU (Graphics Processing Unit) — ban đầu dự kiến sử dụng thiết kế của công ty khởi nghiệp Rivos, đã được Meta mua lại vào năm ngoái. Theo đó, Rivos tuyên bố GPU của họ có thể vận hành hiệu quả mã CUDA của Nvidia — phần mềm chính hiện nay để đào tạo và vận hành các mô hình AI.

Báo cáo cũng chỉ ra rằng, ban đầu Meta dự định sử dụng Olympus để xây dựng các cụm máy chủ lớn, nhưng các lãnh đạo cấp cao của công ty cho rằng, trong giai đoạn gấp rút cạnh tranh với OpenAI và Google, bước đi này có thể gây rủi ro tiềm tàng cho việc đào tạo các mô hình mới.

Cụ thể, phần mềm đào tạo đi kèm với các chip này vốn đã không thể cạnh tranh về độ ổn định với sản phẩm của Nvidia, cộng thêm thiết kế phức tạp của Olympus có thể gây cản trở lớn hơn nữa trong việc sản xuất hàng loạt quy mô lớn. Do đó, Meta hiện tại dự định tiếp tục sử dụng các chip đào tạo của các nhà cung cấp khác, vì phần mềm đi kèm của chúng đã trưởng thành và đáng tin cậy hơn, có thể hỗ trợ tốt hơn cho nhu cầu đào tạo mô hình AI.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim