Bước Nhảy Xương Sao Toàn Diện Mã Nguồn Mở Step 3.5 Flash: Phát Hành Toàn Bộ Mô Hình Tiền Huấn Luyện + Khung Huấn Luyện, Vượt Mặt Top 2 của OpenClaw

robot
Đang tạo bản tóm tắt

Trung Quốc các công ty khởi nghiệp mô hình lớn đã nhảy vọt, sau khi mở mã nguồn cho Step 3.5 Flash, lại tiếp tục mở mã nguồn trọng số tiền huấn luyện (Base), trọng số trung gian (Midtrain) của mô hình Agent này cùng với khung huấn luyện Steptron đi kèm. Theo thông tin, Step 3.5 Flash sử dụng kiến trúc MoE th sparse, tổng số tham số 1960 tỷ, nhưng khi suy luận chỉ kích hoạt khoảng 110 tỷ tham số, tốc độ suy luận tối đa có thể đạt 350 TPS cho các yêu cầu mã đơn. Mô hình này được thiết kế đặc biệt cho các tình huống Agent, thể hiện xuất sắc trong các nhiệm vụ suy luận phức tạp và chuỗi dài, chính thức gọi là khả năng suy luận sâu có thể sánh ngang một số mô hình đóng nguồn hàng đầu. Tính đến nay, mô hình này đã có hơn 300.000 lượt tải trên Hugging Face và đứng đầu trong danh sách xu hướng của OpenRouter. Trong dự án mã nguồn mở nổi tiếng OpenClaw (được cộng đồng Trung Quốc gọi là “Tôm Hùm Nhỏ”), mô hình đã vươn lên vị trí thứ hai. (Báo cáo Khoa Công Bảng)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim