吴说获悉,Coinbase CEO Brian Armstrong 发文表示,公司通过优化基础设施,已将企业 AI 支出削减了近一半,同时 AI 代币使用量仍在指数级增长。其核心降本措施包括:将 GLM 5.2 和 Kimi 2.7 等开源模型作为内部 LLM 网关的默认选项,通过智能路由为任务匹配最具性价比的模型将 LibreChat 等工具的缓存命中率从 5% 大幅提升至 60% 。Armstrong 强调,管理 AI 成本的目标不是限制使用,而是通过减少浪费让指数级增长变得可持续。

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 7
  • 2
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
MechanicalHummingbird
· 9год тому
GLM 5.2 за замовчуванням, чи можна вважати, що ця хвиля виходу на міжнародний ринок вітчизняних моделей вже підтверджена?
Переглянути оригіналвідповісти на0
ElevatorMeme
· 16год тому
Експоненційне зростання + зниження витрат удвічі, команда AI-інфраструктури Coinbase може вийти на ринок курсів.
Переглянути оригіналвідповісти на0
GateUser-2bbf8435
· 16год тому
Ця ідея Брайана незвичайна: не скорочувати бюджет, а скорочувати витрати; використання ШІ подвоюється, а витрати навпаки знижуються — ось справжнє зниження витрат та підвищення ефективності.
Переглянути оригіналвідповісти на0
GateUser-ffe7bee5
· 16год тому
Від 5% до 60%, ця оптимізація кешу, здається, добре розібралася в інженерії підказок.
Переглянути оригіналвідповісти на0
GateUser-870b5e71
· 16год тому
Чи є відкриті рішення для кешування LibreChat? Хочу скопіювати готове.
Переглянути оригіналвідповісти на0
FragmentedSilverStarMap
· 16год тому
60% кеш-хітів піднялося з 5%, цей оптимізаційний обсяг викликає у мене заздрість, ми всередині ще борються на 20%
Переглянути оригіналвідповісти на0
SunshineCollector
· 16год тому
Відкриті моделі + розумна маршрутизація — це справді жорсткий хід, GLM та Kimi одразу стають значенням за замовчуванням, а зекономлені гроші можна знову витратити на додаткові раунди навчання.
Переглянути оригіналвідповісти на0
  • Закріплено