Vercel:Lượng gọi Token của DeepSeek vượt quá OpenAI, chi phí chỉ chiếm 1% tổng chi tiêu

robot
Đang tạo bản tóm tắt
ME AI Tin nhắn, theo dõi hoạt động Beating, Vercel đã phát hành Chỉ số sản xuất AI Gateway năm 2026 vào tháng 6. Báo cáo cho thấy, nhờ vào sự ra mắt của dòng DeepSeek V4 (bao gồm các mô hình Flash và Pro) trên Vercel Gateway vào tháng 5, tỷ lệ lưu lượng Token của DeepSeek đã tăng từ dưới 1% lên 17% trong cùng tháng, vượt qua OpenAI (13%) đứng thứ ba. Tuy nhiên, do giá cả cực kỳ thấp, tổng chi phí của tất cả người dùng sử dụng DeepSeek chỉ chiếm khoảng 1% tổng chi tiêu của gateway. Giá cả là yếu tố chính thúc đẩy sự bùng nổ của DeepSeek. Phí nhập và xuất của DeepSeek V4 Flash cho mỗi triệu Token chỉ là 0,14 USD và 0,28 USD, rẻ hơn các mô hình tiên tiến cùng loại của Anthropic từ 20 đến 50 lần, và rẻ hơn Qwen 3.6 Plus cùng Kimi K2.6 từ 8 đến 12 lần. Các đánh giá cho thấy hiệu suất của DeepSeek V4 đạt tiêu chuẩn, thúc đẩy nhóm phát triển nhanh chóng triển khai trong sản xuất. Mặc dù lưu lượng của các mô hình chi phí thấp tăng vọt, nhưng về tiêu thụ vốn, các mô hình tiên tiến vẫn chiếm ưu thế. Trong tháng 5, phần chi tiêu của Anthropic tăng từ 61% lên 65%, chiếm 70% đến 80% trong các lĩnh vực như tạo ứng dụng, trí tuệ nhân tạo nền tảng và lập trình. Ví dụ, trong lĩnh vực trí tuệ lập trình, DeepSeek đóng góp 49% lưu lượng Token, nhưng chỉ chiếm 4% chi phí, trong khi Anthropic tiêu tốn 70% ngân sách với 28% lưu lượng. Nhóm phát triển đang quản lý ngân sách thông qua định tuyến thông minh, phân luồng các nhiệm vụ tần suất cao, rủi ro thấp đến các mô hình chi phí thấp, chỉ sử dụng mô hình tiên tiến ở các bước quan trọng. Việc xem xét lợi nhuận đầu tư (ROI) cũng làm chậm quá trình nâng cấp mô hình. Ví dụ, Google tháng 5 đã ra mắt Gemini 3.5 Flash với giá cao hơn phiên bản 3.0, dẫn đến quá trình chuyển đổi chậm, cuối tháng 5, 3.0 Flash vẫn chiếm 90% lưu lượng của dòng Flash, trong khi 3.5 Flash chỉ chiếm 7%. Đồng thời, các trí tuệ nhân tạo thể hiện mật độ tiêu thụ Token cực cao, với một phần tư số yêu cầu đã tiêu thụ quá nửa Token. (Nguồn: BlockBeats)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim