Lỗ hổng "Hóa đơn ma" với giá cắt cổ của API Google Gemini: Xóa bộ nhớ đệm cũng bị trừ tiền, không xuất ra cũng tính phí

robot
Đang tạo bản tóm tắt
Theo giám sát Beating, gần đây, diễn đàn nhà phát triển AI của Google đã tiết lộ nhiều trường hợp khẩn cấp về hệ thống tính phí của Gemini API bị mất kiểm soát. Nhiều nhà phát triển trong quá trình sử dụng bình thường đã đối mặt với khoản trừ tiền bất thường hàng triệu đồng do lỗi hệ thống nền tảng, ví dụ có người bị trừ gần 27.000 nhân dân tệ chỉ trong vòng 12 giờ. Hiện tại, nhóm kỹ thuật và bộ phận thanh toán của Google vẫn đổ lỗi lẫn nhau về vụ việc này, chưa đưa ra bất kỳ tuyên bố sửa lỗi chính thức hoặc kênh hoàn tiền nhanh chóng nào.

Sau điều tra, nguyên nhân chính gây ra hóa đơn đắt đỏ cho nhà phát triển là hai lỗi cốt lõi: thứ nhất là lỗ hổng "bộ đệm ma" (幽灵缓存), khi nhà phát triển tạo bộ đệm ngữ cảnh qua API, sau khi hết hạn hoặc bị xóa, danh sách quản lý phía frontend đã trống, nhưng hệ thống tính phí phía sau vẫn tiếp tục "chạy rỗng" với tốc độ hàng nghìn nhân dân tệ mỗi giờ; thứ hai là "bẫy vòng lặp suy nghĩ" (思维死循环), khi kích hoạt các công cụ tìm kiếm trực tuyến, giới hạn ngân sách suy nghĩ của mô hình bị vô hiệu hóa, dẫn đến mô hình rơi vào vòng suy luận vô hạn khi xử lý các nhiệm vụ đơn giản, tiêu tốn hết tối đa 6.4 vạn token rồi bị quá tải và sập, ngay cả khi kết quả cuối cùng là "không có đầu ra" (không trả về câu trả lời hữu ích nào), Google vẫn thu toàn bộ phí suy nghĩ tăng vọt gấp 1500 lần.

Do hệ thống tính phí của Google Cloud có độ trễ nghiêm trọng từ 32 đến 72 giờ, và thiếu cơ chế tự động giới hạn hoặc ngắt kết nối khi vượt quá giới hạn, nhà phát triển đã bị trừ tiền lớn trước khi nhận được cảnh báo. Vì dịch vụ khách hàng chính thức đùn đẩy trách nhiệm, diễn đàn không có phản hồi trực tiếp, để tránh rủi ro tài chính, một số nhà phát triển bị ảnh hưởng đã tuyên bố sẽ hoàn toàn từ bỏ bộ đệm ngữ cảnh và mô hình suy luận của Gemini trong môi trường sản xuất.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim