Trên lý thuyết, chi phí AI lẽ ra đã giảm mạnh đến nay.


Cùng một tác vụ cấp tiên phong tốn $30 mỗi triệu token khi GPT-4 ra mắt năm 2023 nay chỉ còn $1.25 với GPT-5. Mức giảm 96 lần trong ba năm, trên các mô hình có tên tuổi với giá công bố.
Theo bất kỳ quy tắc thông thường nào, hóa đơn AI doanh nghiệp lẽ ra phải giảm mạnh. Thay vào đó, ngân sách AI trung bình của Fortune-500 đã tăng từ $7M năm 2024 lên $19M năm 2026. Gần 3 lần trong hai chu kỳ ngân sách.
Lý do: token rẻ không được tiết kiệm, mà được vũ khí hóa. Một chatbot sử dụng token một lần rồi dừng. Một tác nhân làm việc thực sự chạy nhiều hơn 5 đến 30 lần cho cùng một tác vụ, và một khi suy luận rẻ như vậy, bạn sẽ chỉ nó vào mọi thứ. Mỗi lần giảm giá mở khóa nhiều mức sử dụng hơn so với số tiền tiết kiệm.
Trung tâm chi phí không thu hẹp lại. Nó đã chuyển từ tầng mô hình sang cơ sở hạ tầng bên dưới nó. Đó là nơi hóa đơn thực sự đang được viết, và hầu hết các công ty vẫn chưa mở nó ra.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim