Alibaba lần này loại bỏ gần 80% chi phí nhờ vào bộ đệm ngầm, cơn ác mộng tiêu tiền của Agent dài hạn đã có lời giải rồi

Xem bản gốc
CoinNetwork
Tin tức từ Coinjie.com, nhóm Qwen của Alibaba thông báo rằng trên nền tảng Alibaba Cloud Baille, mô hình flagship của họ là qwen3.7-max đã bật chế độ cache ẩn tự động theo mặc định.
Các nhà phát triển không cần chỉnh sửa mã hoặc chỉ định thêm tham số, có thể trực tiếp tận dụng lợi ích giảm chi phí nhờ cache.
Trong cơ chế tính phí mới, hệ thống sẽ tự động nhận diện và trích xuất tiền tố ngữ cảnh lặp lại trong yêu cầu.
Ngay khi xảy ra cache hit, phí token đầu vào của phần đã hit chỉ còn 20% so với giá gốc, giảm 80% chi phí đầu vào.
Cache ẩn này đặc biệt hướng tới các tác vụ dài và các tình huống agent thông minh có chi phí lớn.
Với cửa sổ ngữ cảnh dài 1 triệu token của qwen3.7-max, khi thực hiện các nhiệm vụ cao cấp như mã hóa tự động, cần đọc đi đọc lại tần suất cao các thư viện mã lớn hoặc tài liệu kiến thức.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim