ME News Tin tức, ngày 16 tháng 5 (UTC+8), các nhà nghiên cứu đã đề xuất Δ-Mem, một hệ thống bộ nhớ trực tuyến hiệu quả được thiết kế đặc biệt cho các mô hình ngôn ngữ lớn. Hệ thống này giảm đáng kể việc sử dụng bộ nhớ bằng cách chỉ lưu trữ và cập nhật các biến đổi gia tăng của hoạt động mô hình, thay vì trạng thái hoạt động đầy đủ. Các thử nghiệm cho thấy, Δ-Mem có thể giảm lượng bộ nhớ sử dụng lên tới 70%, đồng thời duy trì chất lượng đầu ra của mô hình gần như không đổi. Phương pháp này giúp triển khai và vận hành các mô hình ngôn ngữ quy mô lớn trong các môi trường hạn chế tài nguyên, nâng cao khả năng thực thi trực tuyến và học liên tục của chúng. (Nguồn: AiHot)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

12 thích

Phần thưởng
12
10
2
Retweed

Bình luận

Thêm một bình luận

DeltaSmile

· 1giờ trước

Chất lượng đầu ra không mất mát là yếu tố quan trọng nhất, nhiều phương án nén đã hy sinh quá nhiều độ chính xác.

Xem bản gốcTrả lời0

PickingUpAirdropsInTheFog

· 7giờ trước

Khả năng học tập liên tục bị đánh giá thấp, điều này rất quan trọng đối với các mô hình cá nhân hóa.

Xem bản gốcTrả lời0

InvisibleMarketMaker

· 7giờ trước

70% giảm bộ nhớ thực sự ấn tượng, nhưng trong các tình huống trực tuyến, chi phí tính toán cho cập nhật gia tăng có thể trở thành điểm nghẽn mới không?

Xem bản gốcTrả lời0

ColdStartUnderTheAurora

· 7giờ trước

Cuối cùng đã có người nghiêm túc giải quyết vấn đề tường bộ nhớ của LLM, mong chờ các công trình tiếp theo.

Xem bản gốcTrả lời0

HotAirBalloonCrossingMountains

· 7giờ trước

Cảm giác và chú ý thưa có thể được kết hợp sử dụng, nén hai lớp.

Xem bản gốcTrả lời0

PettyLp

· 7giờ trước

Hệ thống bộ nhớ trực tuyến này có vị trí rất chính xác, lấp đầy khoảng trống của giai đoạn suy luận.

Xem bản gốcTrả lời0

CheckTheBlockchainBefore

· 7giờ trước

Sự tương thích của các phương pháp tinh chỉnh hiệu quả về tham số như Hứng thú và LoRA như thế nào.

Xem bản gốcTrả lời0

ProtocolPaladin

· 7giờ trước

Hướng đi này nếu được mở mã nguồn, cộng đồng có thể sáng tạo ra nhiều kiểu dáng khác nhau.

Xem bản gốcTrả lời0

PerpPessimist

· 7giờ trước

Bộ dữ liệu đánh giá nào được sử dụng cho thử nghiệm? Là GLUE hay các nhiệm vụ suy luận phức tạp hơn.

Xem bản gốcTrả lời0

TokenomicsMechanic

· 7giờ trước

70% là giới hạn hay trung bình? Hiệu suất có khác nhau nhiều giữa các mô hình quy mô khác nhau không.

Xem bản gốcTrả lời0

Xem thêm

Chủ đề thịnh hành
Xem thêm
#
IntroducingGateStocks
20.83K Phổ biến
#
WinGoldBarsWithGrowthPoints
1.26M Phổ biến
#
IsraelStrikesIranBTCPlunges
51.69K Phổ biến
#
ArthurHayesSeesHYPEOvertakingSOL
18.18M Phổ biến
#
USIranNegotiationGame
9.57M Phổ biến

Đã ghim

sơ đồ trang web

Δ-Mem：Hiệu quả bộ nhớ trực tuyến phù hợp cho mô hình ngôn ngữ lớn

Chủ đề thịnh hành

IntroducingGateStocks

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

ArthurHayesSeesHYPEOvertakingSOL

USIranNegotiationGame

Đã ghim