Chi phí suy luận chỉ bằng 1/20 của GPT-5.5, mô hình thời gian thực Gemini 3.2 xuất hiện trên Google Cloud

robot
Đang tạo bản tóm tắt

Theo theo dõi Beating, danh sách bộ lọc mô hình trong bảng điều khiển Google Cloud xuất hiện tùy chọn mô hình cơ bản có tên là gemini-3.2-flash-lite-live-preview.
Đây là lần xuất hiện trở lại của dòng mô hình này trên nền tảng chính thức sau khi xuất hiện dấu vết trong gói xây dựng ứng dụng iOS và AI Studio đầu tháng này.
Tùy chọn mới có hậu tố lite và live, cho thấy Google đang phân chia các phiên bản đặc biệt dành cho tương tác thời gian thực cực thấp độ trễ.
Giám đốc điều hành của Abacus.AI, Bindu Reddy, trước đó tiết lộ rằng khả năng mã hóa và suy luận của Gemini 3.2 Flash đạt 92% của GPT-5.5, nhưng nhờ công nghệ chưng cất và làm loãng, chi phí suy luận chỉ bằng một phần hai mươi của nó, với phần lớn truy vấn có độ trễ dưới 200 mili giây.
Cùng với việc giao diện đám mây đã bắt đầu chạy trước, ngành dự đoán rằng mô hình nhẹ tối ưu về chi phí này sẽ chính thức ra mắt tại hội nghị Google I/O ngày 20 tháng 5.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim