Elon Musk: Sự khác biệt giữa Grok V9 và V8 là rất lớn, phiên bản huấn luyện của V9 đã thể hiện hiệu suất tốt hơn

robot
Đang tạo bản tóm tắt
AIMPACT tin nhắn, ngày 15 tháng 5 (UTC+8), Elon Musk đã đăng trên nền tảng X rằng, phiên bản Grok V9 mới nhất (1.5T tham số) đã hoàn thành huấn luyện "hiệu quả rất tốt", và kết quả này vẫn chưa được đưa vào phần huấn luyện bổ sung dữ liệu Cursor. Phiên bản mô hình cơ sở đang phát triển nội bộ hiện tại là V9, quy mô tham số khoảng 1.5 nghìn tỷ, có sự cải thiện rõ rệt so với V8 về làm sạch dữ liệu, phương pháp huấn luyện, quy mô mô hình, và đã được tối ưu hóa cho kiến trúc Blackwell để nâng cao hiệu quả sử dụng sức mạnh tính toán. Elon Musk nhấn mạnh rằng, so sánh, phiên bản v4.2 hiện tại dựa trên mô hình cơ sở V8, quy mô tham số khoảng 0.5T, chạy trên kiến trúc Hopper, vẫn còn hạn chế về chất lượng và phạm vi dữ liệu huấn luyện. Khoảng cách hiệu suất giữa Grok V8 và V9 rất lớn, thế hệ mô hình mới đã đạt được bước nhảy vọt về khả năng tổng thể. (Nguồn: ODAILY)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • 1
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
SudoSage
· 1giờ trước
Từ "nâng cấp vượt bậc" xuất hiện trong lời của Elon Musk, thường có nghĩa là thực sự có chút gì đó đặc biệt
Xem bản gốcTrả lời0
YieldKaraoke
· 2giờ trước
Ngoài vẫn đang chạy Hopper, nội bộ đã là Blackwell, chơi trò chênh lệch thông tin rất rõ ràng
Xem bản gốcTrả lời0
GateUser-53a6e1a8
· 3giờ trước
Việc làm sạch dữ liệu cuối cùng đã được chú trọng, trước đây chất lượng phản hồi của Grok thực sự hay lên xuống thất thường
Xem bản gốcTrả lời0
Don'tCallMeABagHolder.
· 3giờ trước
Tối ưu hóa kiến trúc Blackwell là trọng tâm, việc nâng cao hiệu suất sử dụng công suất tính toán quyết định trực tiếp khả năng sinh lợi
Xem bản gốcTrả lời0
LimeLeverageAlert
· 3giờ trước
Chờ tích hợp Cursor một tay, quy mô tham số của V9 hơi phi lý một chút
Xem bản gốcTrả lời0
BlackVelvetBluePeony
· 3giờ trước
Giải thích tối ưu hóa của Blackwell, ông Huang và Elon Musk ngày càng gắn bó chặt chẽ hơn
Xem bản gốcTrả lời0
Post-RainCancellationAgent
· 3giờ trước
0.5T đến 1.5T với gấp ba lần tham số, sự khác biệt thực sự lớn
Xem bản gốcTrả lời0
  • Đã ghim