Cựu kỹ sư Seed của ByteDance: Một vòng lặp của ByteDance mất nửa năm, Google được đồn chỉ mất ba tháng.

robot
Đang tạo bản tóm tắt
ME News tin tức, ngày 24 tháng 4 (UTC+8), theo giám sát của động sát Beating, Trương Trì, cựu kỹ sư của nhóm Seed tại ByteDance, hiện là trợ lý giáo sư tại Đại học Bắc Kinh, đã tiết lộ trong podcast "Into Asia" rằng ByteDance mất khoảng nửa năm để hoàn thành một đợt huấn luyện mô hình lớn (tiền huấn luyện và hậu huấn luyện), trong khi Google theo tin đồn chỉ mất ba tháng. Ông cho rằng tốc độ lặp lại là một trong những nguyên nhân cốt lõi khiến các công ty Trung Quốc khó bắt kịp. Trương Trì làm việc tại ByteDance khoảng một năm, thuộc nhóm toán học nghiêng về nghiên cứu, ông tự mô tả vị trí của nhóm này "chủ yếu để quảng bá", khác với nhóm tiền huấn luyện và hậu huấn luyện chịu trách nhiệm giao mô hình. Trương Trì mô tả văn hóa "benchmaxxing" (chạy điểm) trong nội bộ Seed: lãnh đạo nhóm đánh giá hiệu suất dựa trên các benchmark phụ trách, tất cả mọi người đều chạy điểm số, "nhưng điều này không thể chuyển đổi thành trải nghiệm tốt trong sử dụng thực tế". Ông nói rằng về mặt lý thuyết, các mô hình của các công ty lớn Trung Quốc đều có thể bắt kịp các mô hình tiên tiến của Mỹ, nhưng khi sử dụng thực tế thì "không đủ tốt". Mục tiêu của Seed là đứng đầu toàn cầu, "nhưng thật đáng tiếc, tôi không nghĩ chúng tôi đã bắt kịp", ngay cả mục tiêu đứng đầu trong nước "cũng chưa đạt được". Cuối năm 2024, Seed tự nhận đã bắt kịp GPT-4o, sau đó DeepSeek ra mắt, nhóm nhận ra khoảng cách vẫn còn, khi anh tham gia, toàn bộ nhóm đang khẩn trương chuyển hướng sang học tăng cường. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim