吴说获悉,Coinbase CEO Brian Armstrong 发文表示,公司通过优化基础设施,已将企业 AI 支出削减了近一半,同时 AI 代币使用量仍在指数级增长。其核心降本措施包括:将 GLM 5.2 和 Kimi 2.7 等开源模型作为内部 LLM 网关的默认选项,通过智能路由为任务匹配最具性价比的模型将 LibreChat 等工具的缓存命中率从 5% 大幅提升至 60% 。Armstrong 强调,管理 AI 成本的目标不是限制使用,而是通过减少浪费让指数级增长变得可持续。

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • 2
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
MechanicalHummingbird
· 6ч назад
GLM 5.2 по умолчанию, эта волна выхода отечественных моделей на международный рынок считается подтверждённой, не так ли?
Посмотреть ОригиналОтветить0
ElevatorMeme
· 12ч назад
Экспоненциальный рост + снижение затрат вдвое, команда AI-инфраструктуры Coinbase может начать продавать курсы.
Посмотреть ОригиналОтветить0
GateUser-2bbf8435
· 13ч назад
У Брайана необычный подход: не сокращать бюджет, а сокращать расточительство. Использование ИИ удваивается, а затраты снижаются — вот это настоящее сокращение затрат и повышение эффективности.
Посмотреть ОригиналОтветить0
GateUser-ffe7bee5
· 13ч назад
От 5% до 60%, эта оптимизация кэша, похоже, хорошо разобралась в инженерии промптов.
Посмотреть ОригиналОтветить0
GateUser-870b5e71
· 13ч назад
Есть ли открытое решение для кэширования LibreChat? Хочу списать.
Посмотреть ОригиналОтветить0
FragmentedSilverStarMap
· 13ч назад
60% кэш-хитов поднялись с 5%, я в шоке от такого улучшения, а у нас внутри всё ещё боремся на 20%.
Посмотреть ОригиналОтветить0
SunshineCollector
· 13ч назад
Открытые модели + интеллектуальная маршрутизация — это действительно жёсткий ход, GLM и Kimi сразу становятся значениями по умолчанию, сэкономленные деньги можно снова пустить на несколько раундов обучения.
Посмотреть ОригиналОтветить0
  • Закреплено