Trong thời kỳ Cách mạng Công nghiệp, than càng rẻ, mọi người càng đốt nhiều. Giờ đây trong thời đại AI, Token cũng vậy


Token rẻ hơn, các sản phẩm AI lại càng có thể đốt nhiều hơn
Trước đây bạn hỏi một câu, mô hình trả lời một câu, rồi kết thúc
Bây giờ bạn chỉ cần nhấn một cái, Agent chạy nền phân chia nhiệm vụ, tra dữ liệu, điều chỉnh công cụ, viết mã, sửa lỗi, tổng kết, chạy một chuỗi quy trình
Vì vậy, một Token đơn lẻ rẻ hơn, nhưng một nhiệm vụ tiêu thụ quá nhiều Token
Đây chính là lý do hóa đơn vẫn đang tăng lên
Sau khi máy hơi nước tiết kiệm nhiên liệu hơn, Anh Quốc không ít đốt than hơn. Bởi vì than trở nên có lợi hơn, nhiều máy móc, nhà máy, đường sắt bắt đầu đốt than
Token cũng theo logic này
Rẻ hơn, Agent, Nghiên cứu Sâu, Lập trình AI, ngữ cảnh dài, tự động hóa doanh nghiệp mới thực sự bắt đầu chạy
Vì vậy, chi phí của AI đang chuyển từ huấn luyện sang suy luận
Huấn luyện tiêu tốn một thời gian, còn suy luận thì liên tục tiêu tốn. Người dùng trực tuyến, nó vẫn đang đốt. Agent đang chạy, nó vẫn đang đốt. Ngữ cảnh càng dài, bộ nhớ đệm càng lớn, bộ nhớ, băng thông, điện năng, tản nhiệt đều bị ảnh hưởng
Đây cũng là lý do tại sao chuỗi ngành công nghiệp AI không thể chỉ nhìn vào GPU
HBM, DRAM, SSD, đóng gói tiên tiến, mô-đun quang, chip chuyển đổi, CPU, chip suy luận, tất cả đều được định giá lại bởi nhu cầu suy luận này
Các công ty ứng dụng AI cũng sẽ bị buộc phải phân tầng
Chỉ đóng gói một lớp giao diện, hoàn toàn dựa vào API đóng nguồn, càng nhiều người dùng, hóa đơn càng lớn, lợi nhuận càng mỏng
Rào cản thực sự sẽ đi xuống: định tuyến, định lượng, bộ đệm, xử lý theo lô, cắt xén ngữ cảnh, thay thế mô hình lớn bằng mô hình nhỏ
Ừ, Token chính là than.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim