Elvis Sar nói đúng, sức mạnh tính toán đổ vào lớp thực thi thì thực sự hơn hẳn các tham số trong bộ nhớ đệm, nhưng làm thế nào để lấp đầy cái hố thất bại kích hoạt của mô hình yếu đây

Xem bản gốc
BlockBeatNews
9B mô hình nhỏ tự cập nhật kỹ năng trí tuệ nhân tạo, lợi ích gần bằng mô hình lớn hàng đầu Claude
Động sát Beating giám sát hiển thị, các thể thông minh tự tiến hóa thông qua cập nhật thiết bị bên ngoài. Nghiên cứu phân tách quá trình tiến hóa thành hai chiều: cập nhật thiết bị và lợi ích từ thiết bị, phát hiện rằng cập nhật thiết bị làm cho khả năng nền tảng trở nên phẳng hơn, chênh lệch lợi ích giữa các mô hình chỉ còn 3,1%, cập nhật kỹ năng của Qwen 3.5-9B với 9B và Claude Opus 4.6 gần như tương đương, gợi ý rằng có thể hoàn thành quá trình tiến hóa bằng các mô hình chi phí thấp. Lợi ích từ thiết bị thể hiện đặc điểm không đơn điệu, mô hình hàng đầu gần như đạt đỉnh, mô hình yếu có khả năng nâng cao lớn nhưng lợi ích ít, đồng thời dễ gặp phải “thất bại kích hoạt thiết bị” và “thất bại tuân thủ thiết bị”. Elvis Sar đồng tình, đề xuất tập trung sức mạnh tính toán vào thực thi thể thông minh, tăng cường khả năng tự thức tỉnh của thiết bị và tuân thủ lệnh dài hạn.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim