Đồng sáng lập OpenAI tuyên bố $110 tỷ vẫn chưa thể đáp ứng nhu cầu, việc huấn luyện trước chuyển sang tối ưu hóa chung để giảm chi phí

robot
Đang tạo bản tóm tắt

Theo giám sát của 1M AI News, đồng sáng lập của OpenAI, Greg Brockman, đã suy ngẫm về bước nhảy trong năng lực lập trình của AI dự kiến vào tháng 12/2025 trong một cuộc phỏng vấn. Ông đã sử dụng một prompt thử nghiệm mà ông đã giữ trong nhiều năm để đo tiến độ: yêu cầu AI xây dựng một trang web mà trước đây ông phải mất hàng tháng để hoàn thành khi ông đang học lập trình. Trong suốt năm 2025, nhiệm vụ này cần nhiều prompt và mất khoảng bốn giờ để hoàn thành; đến tháng 12, nhiệm vụ đó có thể được hoàn thành chỉ với một prompt và với chất lượng cao. Ông cho biết mô hình mới cho phép AI nhảy từ “có thể hoàn thành khoảng 20% các tác vụ” lên “khoảng 80%”, một thay đổi buộc mọi người phải “tái tổ chức quy trình làm việc xung quanh AI”. Về việc phân bổ khoản tài trợ 110 tỷ USD, Brockman ví sức mạnh tính toán như “thuê nhân viên bán hàng”: miễn là sản phẩm có một kênh bán hàng có thể mở rộng, việc thuê thêm nhân viên bán hàng có thể tạo ra nhiều doanh thu hơn. Sức mạnh tính toán không phải là một khoản chi phí, mà là một trung tâm tạo doanh thu. Ông nhớ lại một cuộc trò chuyện với đội ngũ của mình vào đêm trước khi ChatGPT ra mắt: “Họ hỏi, ‘Chúng ta nên mua bao nhiêu sức mạnh tính toán?’ Tôi nói, ‘Tất cả.’ Họ trả lời, ‘Không, không, không, nghiêm túc đi, chúng ta nên mua bao nhiêu?’ Tôi nói, ‘Dù chúng ta xây dựng theo cách nào, chúng ta cũng sẽ không đáp ứng kịp nhu cầu.’” Nhận định này vẫn đúng cho đến tận ngày nay, và việc mua sắm sức mạnh tính toán cần phải được chốt trước 18 đến 24 tháng. Về cách tận dụng sức mạnh tính toán này, Brockman tiết lộ rằng OpenAI không còn chỉ theo đuổi quy mô tiền huấn luyện lớn nhất nữa, mà thay vào đó là tối ưu hóa đồng thời năng lực tiền huấn luyện và chi phí suy luận: “Bạn không nhất thiết phải làm nó lớn nhất có thể, vì bạn cũng cần cân nhắc vô số các kịch bản sử dụng suy luận ở giai đoạn sau; thứ bạn thực sự muốn là giải pháp tối ưu của trí tuệ nhân với chi phí.” Tuy nhiên, ông kiên quyết phản đối ý tưởng rằng “tiền huấn luyện không còn quan trọng nữa”, tin rằng mô hình nền tảng càng thông minh thì hiệu suất của các giai đoạn học tăng cường và suy luận tiếp theo càng cao, và vẫn có “nhu cầu tuyệt đối” về các GPU Nvidia để hỗ trợ đào tạo tập trung quy mô lớn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim