Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
CFD
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
GateRouter
Lựa chọn thông minh từ hơn 40 mô hình AI, với 0% phí bổ sung
Google Gemini API bùng nổ "lỗ hổng tính phí bộ đệm", nhà phát triển xóa bỏ không hợp lệ bị trừ mạnh 20.000 real
Google AI nhà phát triển diễn đàn gần đây đã tiết lộ một sự cố nghiêm trọng về phí API bất thường. Một nhà phát triển đã đăng bài cầu cứu, chỉ ra rằng chức năng bộ nhớ đệm văn bản Gemini 3 Flash (Context Caching) mà họ đang sử dụng, sau khi xóa sạch qua API ở phía frontend, phía backend vẫn tiếp tục tính phí với tốc độ đáng kinh ngạc hơn nghìn đồng mỗi giờ, chỉ trong vài ngày đã tích lũy hóa đơn gần 20.000 real Brazil (khoảng vài nghìn USD). Hiện tại, nhà phát triển này buộc phải tạm dừng toàn bộ dịch vụ API Gemini để cắt đứt dòng tiền, sự kiện này đã gây chú ý lớn trong cộng đồng nhà phát triển.
(Tiền sử: Trump kêu gọi đầu tư vào các doanh nghiệp AI của Mỹ, dự kiến trong tuần này sẽ đàm phán với OpenAI, Anthropic, xAI, Altman đề xuất ý tưởng "quỹ tài sản công cộng")
(Thông tin bổ sung: Trước IPO của SpaceX, Google đã chi hàng trăm triệu USD mỗi tháng để thuê 110.000 GPU NVIDIA cho tính toán)
Mục lục bài viết
Chuyển đổi
Chi phí ẩn của API mô hình trí tuệ nhân tạo lớn luôn là điểm đau được các nhà phát triển đặc biệt quan tâm, nhưng gần đây, API Gemini mới nhất của Google lại phát hiện ra lỗ hổng "phí ma" gây sốc. Trên diễn đàn nhà phát triển AI của Google, một bài đăng có tiêu đề "Khẩn cấp: Vấn đề tăng phí bộ nhớ đệm lớn (Phần 2)" đã tiết lộ rằng dịch vụ bộ nhớ đệm Gemini 3 Flash (Context Caching) có khả năng bị mất kiểm soát nghiêm trọng trong cơ chế tính phí phía sau.
Xóa bộ nhớ đệm vẫn tiếp tục bị trừ tiền! Một giờ bùng nổ nghìn đồng
Theo dữ liệu chi tiết hóa đơn BigQuery do nhà phát triển Danilo_Oliveira cung cấp, sự cố bất thường này bắt đầu từ ngày 3 tháng 6 năm 2026. Ban đầu, phí cho "Token lưu trữ bộ nhớ đệm văn bản trong một giờ của Gemini 3 Flash (SKU ID: 583D-5DB6-4555)" duy trì khoảng 20 đến 30 real Brazil (BRL) mỗi giờ, với lượng sử dụng khoảng 4 triệu Token giờ.
Tuy nhiên, đến ngày 6 tháng 6, tình hình chuyển biến xấu đi nhanh chóng, chi phí tăng theo cấp số nhân. Một giờ sử dụng vượt quá 200 triệu Token giờ, mỗi giờ trừ tiền lên tới hơn 1.000 real Brazil. Đến sáng ngày 7 tháng 6, tổng cộng 341 lần tính phí bất thường đã đẩy hóa đơn tích lũy lên tới 17.847,21 real Brazil, cho thấy hệ thống tính phí đã hoàn toàn mất kiểm soát.
Tạm dừng API khẩn cấp để cắt đứt dòng tiền, chính thức chưa có sửa lỗi
Đối mặt với hóa đơn khổng lồ ngày càng tăng như quả bóng tuyết, nhà phát triển này đã áp dụng mọi biện pháp phòng ngừa có thể. Anh không chỉ lập tức tắt các script tạo bộ nhớ đệm, mà còn dùng API REST chính thức của Google để kiểm tra, xác nhận danh sách bộ nhớ đệm đã "hoàn toàn xóa sạch". Tuy nhiên, điều khiến người ta thất vọng là, dù frontend hiển thị không còn bộ nhớ đệm, hệ thống phía sau vẫn tiếp tục trừ tiền không kiểm soát.
Vì nghi ngờ lỗi do server phía sau của Google không xóa đúng các ghi chú bộ nhớ đệm, nhà phát triển đã khẩn cấp mở ticket #720261 về vấn đề hóa đơn để thương lượng với chính thức. Để ngăn chặn dòng tiền đen tối mở rộng, cuối cùng anh buộc phải "bỏ hết tất cả" — tắt hoàn toàn dịch vụ API Gemini trong dự án Google Cloud.
Cộng đồng nhà phát triển hoảng loạn, cần cẩn trọng khi sử dụng chức năng bộ nhớ đệm
Sự kiện này sau khi được tiết lộ trên diễn đàn đã nhanh chóng thu hút sự chú ý và thảo luận của các đồng nghiệp. Vì chức năng bộ nhớ đệm (Context Caching) vốn nhằm giải quyết vấn đề chi phí và độ trễ khi xử lý văn bản dài quá mức của mô hình ngôn ngữ lớn (LLM), nay lại trở thành "hố đen" hút sạch tiền, điều này chắc chắn khiến các doanh nghiệp và nhà phát triển cá nhân đang chuẩn bị triển khai quy mô lớn API Gemini cảm thấy lạnh người.
Trước khi Google chính thức sửa lỗi và công khai giải thích về lỗ hổng phía sau này, cộng đồng mạnh mẽ khuyến cáo các nhà phát triển đang sử dụng chức năng bộ nhớ đệm của API Gemini nên theo dõi sát sao hóa đơn Google Cloud theo thời gian thực, đặt giới hạn ngân sách chặt chẽ và thiết lập cảnh báo để tránh sáng hôm sau tỉnh dậy đã đối mặt với khoản phí khổng lồ không thể chịu nổi.