「Kết quả của hai năm nghiên cứu」: Đồng sáng lập OpenAI lần đầu nói về mô hình Spud, phản hồi về lời chỉ trích của Dario 「đặt cược sinh tử」

robot
Đang tạo bản tóm tắt

Theo dõi từ 1M AI News, Phó chủ tịch (Co-founder) của OpenAI, Greg Brockman, lần đầu tiên trong một cuộc phỏng vấn đã đề cập từ góc độ kỹ thuật đến mô hình nền tảng huấn luyện trước thế hệ mới bên trong OpenAI, với mã nội bộ là Spud. Ông mô tả Spud là “kết tinh của khoảng hai năm nghiên cứu”, là nền tảng cho mọi cải tiến năng lực tiếp theo của OpenAI. Ông cũng giải thích quy trình sản xuất mô hình: trước hết tạo ra mô hình nền tảng thông qua huấn luyện trước (pre-training), sau đó cho mô hình trải qua học tăng cường để luyện giải bài trong nhiều tình huống, và cuối cùng thực hiện huấn luyện tinh chỉnh hậu kỳ (post-training) ở các lớp liên quan đến hành vi và tính khả dụng. Trong 18 tháng qua, trọng tâm chính của ông là mở rộng cơ sở hạ tầng GPU và khung huấn luyện.

Về năng lực của Spud, Brockman đưa ra kỳ vọng mang tính định tính thay vì định lượng: mô hình sẽ có thể giải quyết các vấn đề khó hơn, hiểu lệnh (instruction) chính xác hơn, nắm bắt ngữ cảnh sâu hơn, và giảm đi kiểu “mùi của mô hình lớn” (big model smell). Ông lấy ví dụ về một kỹ sư cộng tác chặt chẽ: giữa GPT-5.2 và GPT-5.3, kỹ sư này từ “hoàn toàn không thể dùng AI để làm kỹ thuật hệ thống cấp nền” đã trở thành “hãy đưa cho nó một bản thiết kế (design document), nó có thể thực hiện chức năng, thêm các chỉ số giám sát và khả quan sát (observability), chạy bộ phân tích hiệu năng rồi tối ưu tiếp, và kết quả chính xác là thứ anh ấy muốn”.

Người phỏng vấn dẫn lời trước đó của CEO Anthropic Dario Amodei: “Có một số tay chơi đang liều mạng (yoloing), kéo rủi ro lên quá cao, tôi thực sự rất lo”, và đề cập rằng Amodei cho rằng nếu dự báo lệch đi dù chỉ một chút, công ty có thể phá sản. Brockman phản hồi thẳng: “Tôi không đồng ý. Chúng tôi luôn suy nghĩ rất thấu đáo, và chúng tôi thấy rõ xu hướng sắp tới.” Ông cho rằng OpenAI là công ty sớm nhất nhận ra nút thắt cổ chai về năng lực tính toán (compute). Còn các công ty khác “đại khái đến tận cuối năm ngoái mới nhận ra điều đó, bắt đầu đặt mua năng lực tính toán nhưng đã không còn mua được nữa”. Về rủi ro phá sản, ông nhận định “thực tế còn nhiều ‘lối thoát dốc’ (exit ramps) hơn”, và quy kết khoản cược này vào đánh giá cho toàn ngành chứ không phải cho riêng một công ty: “Anh có tin rằng công nghệ này có thể tạo ra và cung cấp cho chúng ta giá trị to lớn như thứ mà chúng ta đang thấy hay không?”

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim