Google Gemini kích hoạt API Tương tác: Tái cấu trúc trí tuệ nhân tạo, chấm dứt "hóa đơn ma"

robot
Đang tạo bản tóm tắt
ME AI Thông báo, theo theo dõi Beating, Google chính thức đặt API Tương tác làm giao diện mặc định trong Gemini API và Google AI Studio, giao diện cũ generateContent sẽ bước vào giai đoạn bảo trì. Giao diện mới sẽ đóng gói toàn bộ các cuộc đối thoại nhiều vòng, suy nghĩ của mô hình, gọi công cụ và kết quả thực thi, đồng thời lưu trữ trên máy chủ dưới dạng tài nguyên Interaction.
Lợi ích trực tiếp nhất là tiết kiệm tiền bạc và công sức. Do trạng thái đối thoại sẽ tự động được lưu trữ trên máy chủ, khi trò chuyện nhiều vòng, phía khách hàng chỉ cần gửi ID tương tác của bước trước, Google có thể tự động tái sử dụng và tăng tỷ lệ truy cập bộ nhớ đệm, giảm đáng kể chi phí Token.
Đối với các nhiệm vụ tốn thời gian như chạy sandbox mã hoặc tìm kiếm sâu, nhà phát triển có thể bật chế độ nền, để công việc chạy bất đồng bộ trong nền. Ngoài ra, các bước trung gian như suy nghĩ của mô hình, gọi công cụ đều có thể xem trực tiếp, thuận tiện cho việc kiểm tra lỗi trong quá trình vận hành của trí tuệ nhân tạo.
Việc tái cấu trúc phía dưới đã giải quyết trực tiếp cuộc khủng hoảng tính phí bùng nổ vào đầu tháng 6. Lúc đó, sau khi xóa cache thủ công do độ trễ đồng bộ trên đám mây, các tài nguyên đã đăng xuất vẫn tiếp tục chạy nền, dẫn đến một số tài khoản bị trừ gần 27.000 nhân dân tệ trong vòng 12 giờ.
Ngoài ra, khi mô hình truy xuất dữ liệu qua mạng, dễ rơi vào vòng lặp suy nghĩ chết, trong trạng thái "zero output" không có phản hồi nào, vẫn bị tính phí theo 64.000 token đầy đủ.
API Tương tác thay thế việc xóa cache thủ công bằng "bộ nhớ đệm ngầm" được máy chủ quản lý, đồng thời cho phép nhà phát triển giám sát và dừng bước suy nghĩ, cung cấp một phương thức phòng ngừa tính phí an toàn hơn.
Vì các mô hình tiên tiến và chức năng trí tuệ nhân tạo của Google trong tương lai (ví dụ Deep Research) sẽ chỉ hỗ trợ API Tương tác, chính thức khuyến nghị nhà phát triển hoàn tất việc thích nghi sớm.
(Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim