Thuật toán mới của Google tuyên bố có thể "nén bộ đệm KV gấp 6 lần" Phần ngành lưu trữ của thị trường chứng khoán Mỹ chịu áp lực giảm sút

robot
Đang tạo bản tóm tắt

Thứ Tư, sau khi thị trường Mỹ mở cửa, trong bối cảnh tâm lý chung còn khá tích cực, lĩnh vực lưu trữ lại có xu hướng giảm ngược lại. Tính đến thời điểm gửi bài, Micron giảm 3.57%, SanDisk giảm 4.12%, Western Digital và Seagate Technology cũng đồng loạt giảm.

Về sự biến động bất thường của thị trường ngày hôm nay, nhiều nguồn tin đều hướng chỉ trích Google. Trước đó, gã khổng lồ AI đã giới thiệu một thuật toán nén có thể giảm nhu cầu bộ nhớ của hệ thống trí tuệ nhân tạo, gọi là TurboQuant.

Theo giới thiệu của Google, công nghệ nén TurboQuant nhằm giảm thiểu dung lượng bộ nhớ của các mô hình ngôn ngữ lớn và công cụ tìm kiếm dựa trên vector. Thuật toán này chủ yếu nhắm vào vấn đề tắc nghẽn của bộ đệm khóa-giá trị (key-value cache) trong hệ thống AI, vốn dùng để lưu trữ thông tin truy cập tần suất cao. Khi khung ngữ cảnh mở rộng, các bộ đệm này trở thành điểm nghẽn chính về bộ nhớ.

TurboQuant có thể nén bộ đệm khóa-giá trị xuống còn 3 bit mà không cần huấn luyện lại hoặc tinh chỉnh mô hình, đồng thời gần như giữ nguyên độ chính xác của mô hình. Các thử nghiệm với các mô hình mã nguồn mở như Gemma, Mistral cho thấy, công nghệ này có thể đạt hiệu quả nén bộ nhớ của bộ đệm khóa-giá trị khoảng 6 lần.

Ngoài ra, kết quả thử nghiệm trên bộ tăng tốc Nvidia H100 cho thấy, so với vector khóa chưa được lượng hóa, thuật toán này có thể đạt hiệu suất tăng khoảng 8 lần. Các nhà nghiên cứu cũng cho biết, công nghệ này không chỉ giới hạn trong các mô hình AI mà còn hỗ trợ khả năng truy xuất vector trong các công cụ tìm kiếm quy mô lớn.

Google dự kiến sẽ trình diễn công nghệ TurboQuant tại Hội nghị Hiện tượng Học Quốc tế (ICLR 2026) vào tháng 4 tới.

Có thể thấy, dù triển vọng ứng dụng của công nghệ này vẫn còn nhiều câu hỏi, nhưng thị trường đã bắt đầu phản ánh kỳ vọng về sự thay đổi trong nhu cầu bộ nhớ.

Về các biến động mới nhất, nhà phân tích TMT của Ngân hàng Wells Fargo, Andrew Rocha, nhận định: “Khi khung ngữ cảnh mở rộng liên tục, quy mô lưu trữ dữ liệu trong bộ đệm KV tăng vọt, đẩy cao nhu cầu về dung lượng bộ nhớ. TurboQuant chính là công cụ nén trực tiếp chi phí này. Nếu công nghệ này được áp dụng rộng rãi, sẽ có lợi cho đường cong chi phí bộ nhớ.

Rocha cũng cho biết, công nghệ này có thể ảnh hưởng đến dự báo về nhu cầu về dung lượng bộ nhớ trong tương lai.

Ông viết: “Nếu yêu cầu về dung lượng bộ nhớ cần thiết cho các ứng dụng AI này giảm đáng kể, thị trường sẽ nhanh chóng đánh giá lại mức dung lượng bộ nhớ còn cần thiết.”

Tuy nhiên, Rocha cũng chỉ ra rằng, hiện vẫn chưa rõ công nghệ này chỉ phù hợp với hệ sinh thái của Google hay có thể mở rộng sang các phòng thí nghiệm AI khác. Ngoài ra, kết quả thử nghiệm trong môi trường phòng thí nghiệm có thể không dễ dàng chuyển đổi thành hiệu suất thực tế trong môi trường sản xuất.

Điều đáng chú ý là, dù là nhân tố gây xáo trộn trong lĩnh vực lưu trữ, Google cũng chưa thu được lợi ích gì rõ ràng. Giá cổ phiếu của công ty đã giảm xuống dưới 290 USD trong ngày thứ Tư, đã giảm gần 17% so với đỉnh cao lịch sử 349 USD ghi nhận vào đầu tháng 2, cách đó không xa mức tâm lý 20%.

(Nguồn: Tài chính Liên đoàn)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$2.32KNgười nắm giữ:0
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$2.37KNgười nắm giữ:2
    0.07%
  • Vốn hóa:$2.37KNgười nắm giữ:2
    0.07%
  • Ghim