Brian Armstrong: Pengeluaran AI Coinbase hampir berkurang setengahnya, sementara penggunaan Token tetap meningkat.

robot
Pembuatan abstrak sedang berlangsung

吴说获悉,Coinbase CEO Brian Armstrong 发文分享了在代币使用量指数级增长背景下保持 AI 开支稳定的实践经验。Armstrong 表示,公司并未采取设置使用上限等限制手段,而是通过优化默认模型、智能路由与缓存策略来实现降本增效:在默认模型方面,引入 GLM 5.2 和 Kimi 2.7 等开放权重模型以替代昂贵的通用模型;通过路由机制根据任务需求匹配模型;利用缓存预处理与任务会话管理减少 Token 浪费(缓存命中率从 5% 提升至 60%)。得益于这一系列优化,Coinbase 的 AI 支出已近乎减半,同时 Token 使用量仍保持增长。

Terjemahan dalam Bahasa Indonesia: Wu mengatakan, CEO Coinbase Brian Armstrong menerbitkan artikel yang membagikan pengalaman praktis dalam menjaga stabilitas pengeluaran AI di tengah pertumbuhan eksponensial penggunaan token. Armstrong menyatakan bahwa perusahaan tidak menerapkan batasan seperti menetapkan batas penggunaan, melainkan mengoptimalkan model default, perutean cerdas, dan strategi cache untuk mengurangi biaya dan meningkatkan efisiensi: dalam hal model default, mereka memperkenalkan model bobot terbuka seperti GLM 5.2 dan Kimi 2.7 untuk menggantikan model umum yang mahal; melalui mekanisme perutean, mereka mencocokkan model berdasarkan kebutuhan tugas; menggunakan cache preprocessing dan manajemen sesi tugas untuk mengurangi pemborosan token (tingkat hit cache meningkat dari 5% menjadi 60%). Berkat serangkaian optimasi ini, pengeluaran AI Coinbase hampir berkurang setengahnya, sementara penggunaan token tetap tumbuh.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 5
  • 1
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
GateUser-d2b4d9c6
· 2jam yang lalu
Tanpa batasan + routing cerdas, ide ini layak ditiru.
Lihat AsliBalas0
HotAirBalloonCrossingMountains
· 2jam yang lalu
Token naik, pengeluaran turun, operasi Armstrong ini seperti buku teks.
Lihat AsliBalas0
GateUser-673fb6fa
· 2jam yang lalu
GLM 5.2 rasio harga-kinerja memang sangat kompetitif, kami juga beralih.
Lihat AsliBalas0
BerryColdWallet
· 2jam yang lalu
Tingkat hit cache 5%→60% sangat tidak masuk akal, inilah pengurangan biaya yang sesungguhnya.
Lihat AsliBalas0
GateUser-94818fd0
· 2jam yang lalu
Model bobot terbuka sekarang sangat populer, perusahaan besar sumber tertutup mendapat tekanan besar.
Lihat AsliBalas0