Armstrong この度のコスト削減と効率向上の操作は確かにハードコアで、キャッシュヒット率が5%から60%に引き上げられ、AI支出は直接半減し、Tokenはまだ上昇中であり、研究する価値がある。

TOKEN-1.27%
原文表示
WuSaidBlockchainW
Brian Armstrong:CoinbaseのAI支出はほぼ半減したが、トークン使用量は引き続き増加している。
Armstrongは、トークン使用量が急増する中でのコスト削減と効率化の方法を共有:制限を設けず、デフォルトモデルの最適化、スマートルーティング、キャッシュ戦略によるコスト管理。GLM 5.2、Kimi 2.7などのオープンウェイトモデルを採用し、高価な汎用モデルを代替、タスクに応じてルーティングをマッチング、キャッシュの前処理とセッション管理でトークンの無駄を削減、ヒット率を5%から60%に向上。その結果、AI支出はほぼ半減し、トークン使用量は依然として増加している。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし