ロフリー:Claudeのサブスクリプション封鎖の背後にある、真の解決策はより安価なトークンではない

robot
概要作成中

(出典:Machi Zhixin)

Machi Zhixin 編集部

エージェントの時代には、正しい課金とエンジニアリング設計の哲学が必要です。これは、XでXiaomi MiMoの大規模モデル責任者であるロウ・フーリーが述べた見解です。

先日、私たちはあるニュースを報じました――Anthropicは、これよりClaude ProおよびMaxのサブスクユーザーが、サブスクリプション枠をOpenClawなどのサードパーティ製エージェントフレームワークに使うことを禁止すると発表しました。引き続き使いたいのなら、従量課金のAPIに切り替える必要があります。これにより、サブスク・モデルで「ロブスター」をやっていた多くのClaudeユーザーが瞬時に困惑しました。

Anthropic公式の説明によると、サブスク制の料金モデルは本来、「個人ユーザーの通常の利用強度」を前提に設計されていました。しかしOpenClawのような自動化エージェントツールの利用強度は、想定をはるかに超えています――重度ユーザーが月200ドルのサブスク料金だけを支払っているのに、価値5000ドル分の計算資源を消費し、Anthropicに大きなコスト負担をもたらしているとのことです。

このニュースが出ると、各所の反応はさまざまでした。「やられた」というように、サブスク・モデルの魅力が瞬時に失われたと感じる人もいれば、拍手する人もいました。効率の悪い利用を整理し、プラットフォーム全体の持続可能性を守るためだと考えたのです。

どのような声であれ、核心的な問題が露呈しました。現在のトークン課金モデルでは、もはや挑戦に十分に対応しづらく、より賢く、より持続可能な計算資源の使い方が必要なのです。

投稿の中でロウ・フーリーはまず、Anthropicのサブスク制はそもそも赤字を埋めながら回しているのだと指摘しています。

Claude Codeのサブスク制は、設計の行き届いた計算資源のバランス配分システムです。私の判断では――おそらく儲かっていませんし、場合によっては赤字です。ただし、APIの利益率が10〜20倍なら話は別ですが、それは疑わしい。サードパーティのフレームワークがどれだけの赤字を生んでいるのかは正確に計算できませんが、私は近距離でOpenClawのcontext管理を見たことがあります――書き方がひどい。ユーザー1回のリクエストの中で、複数ラウンドの低価値なツール呼び出しがトリガーされ、それぞれが独立したAPIリクエストとして送信されます。そして毎回、非常に長いコンテキストウィンドウ(往々にして10万トークン超)を携えています。キャッシュヒットがあっても、極めて無駄が多い。極端な場合、他のリクエストのキャッシュ未ヒット率まで引き上げてしまいます。

換算すると、ユーザー1回のリクエストで実際に発生するAPI呼び出し回数は、Claude Code自身のフレームワークに比べて何倍にもなります。APIの価格に置き換えると、実コストはサブスク価格の数十倍程度です。これは単なる差ではなく――穴です。

今回、サブスクユーザーが切断された痛みについて、彼女は「この痛みは長期的には良いことになり得る。エンジニアリングの進歩を後押しする」と考えています。

OpenClaw、OpenCodeのようなサードパーティフレームワークは、API経由でClaudeを呼び出すこと自体はできます。ただしサブスクの“ただ乗り”はできなくなっただけです。短期的には、これらのAgentユーザーは大きな痛みを感じるでしょう――コストが簡単に数十倍まで跳ね上がります。しかし、この圧力こそが、これらのフレームワークに対して、context管理を真面目に改善し、処理済みのコンテキストを再利用するためにpromptキャッシュのヒット率を最大化し、無効なトークン消費を削減するよう促す動機になります。痛みはやがてエンジニアリングの規律に転化します。

同時に彼女は警告も発し、大規模モデル企業に対して、盲目的な価格競争をしないよう促しています。安くトークンを売っておきながら、サードパーティのツールで羊を刈らせてしまうのは罠だと。

大規模モデルのメーカーの皆さんに言いたいのは、コーディングのサブスク価格を、出血せずにどう設定するのかを十分に考え抜く前に、価格の底まで盲目的に巻き込まれないでほしいということです。トークンを極めて安く売りつつ、サードパーティフレームワークに大きく門戸を開けると、見た目はユーザーに優しいように見えて、実は罠になります――Anthropicは今まさにこの罠から這い出しているところです。より深い問題は、もしユーザーが時間と労力を質の低いAgentフレームワークに費やし、不安定で遅い推論サービスに費やし、コスト削減のために縮小されたモデルに費やしたあげく、結局何もできないと気づくことになれば――それはユーザー体験と定着(リテンション)の双方にとって悪循環になる、という点です。

さらに彼女は、これから小米が最近リリースしたMiMo Token Planについても紹介し、「私たちが追求しているのは、長期的に安定して高品質なモデルとサービスを提供することだ」と強調しています。

MiMo Token Planについて――サードパーティフレームワークの接続をサポートし、tokenのクオータに基づいて課金します。ロジックは、Claudeが新たに導入したextra usageパックと一致しています。なぜなら私たちは、長期的に安定して高品質なモデルとサービスを提供することを追求しているからです――衝動的に支払わせて、船を見捨てるようなことはしません。

最後に彼女は、現在の世界の計算資源供給はすでに、Agentが生み出すtoken需要についていけていないと指摘しました。本当の打開策は、もっと安いtokenではなく、協調的な進化――「より少ないtokenのAgentフレームワーク」×「より強力で、より高効率なモデル」です。Anthropicの今回の行動は、意図していようがいまいが、オープンソースとクローズドの両方を含むエコシステム全体を、この方向へ押し出しています。たぶん良いことです。

ロウ・フーリーの見解に対して、開発者コミュニティの反応は強く、議論の焦点は「Anthropicが正しいのかどうか」から、より根本的ないくつかの問題へと素早く移っていきました。

1、これは価格設定をめぐる論争ではなく、AI経済学の構造的な書き換えだ。

ロウ・フーリーが言ったとおり、AIサービスの単位コストは、決してモデル単体で決まるのではなく、「モデル×フレームワーク×context管理」の3つが重なって決まります。Anthropicの今回の行動は、意図せずしてエージェントフレームワークに自然選択の圧力をかけることになったのです。

もっと直截に言う人もいます。今回Anthropicが送った本当のシグナルは――オーケストレーション層こそがプロダクトであり、モデルそのものだけではない、ということだと。サブスク制とAPI課金の間にある緊張は、より深いこのロジックの表面的な症状に過ぎません。

2、まずは価格を罵るのを急がず、計算資源がどう燃やされているかを見よう。

ロウ・フーリーが言う「計算資源の浪費」は、現場の人々の間で強い共感を得ました。ある人は一針で刺すように言いました。これは「AIが高すぎる」という問題ではなく、「計算資源が台無しにされている」問題だ、と。雑なフレームワーク設計に、大きすぎるコンテキストウィンドウ、さらに不要な冗長呼び出しを加えることで、燃やしたお金は何の実質的な成果にも変わらないのです。

より深い洞察は、ある開発者からもたらされました。彼は、Claude Codeにおけるcontextの取り扱いの意思決定は、決してデフォルトパラメータの話ではなく、「何を保持し、何を捨て、いつ圧縮するか」を何度も練り直して最終的にアーキテクチャへ焼き込んだ判断力だ、と指摘しました。サードパーティフレームワークに欠けているのは機能ではなく、このように内蔵されたエンジニアリングの見識です。

別の開発者は、自身の経験でそれを裏づけました。彼は先月、顧客向けに組み立てた古いオーケストレーション層の冗長ロジックを大量に整理するのに、多くの時間を費やしたそうです。「散らかったものを片付けるほうが、当初組み立てるよりよほど大変だった」と。

3、市場の淘汰はすでに始まっているが、結末は未定だ。

ロウ・フーリーは、コストの圧力がフレームワークの進化を後押しすると考えています。しかし開発者たちは、より厳しい問題を提起しました。サードパーティフレームワークは、効率のギャップを十分に素早く埋めて、APIの価格設定が経済的にもまだ納得できる状態を維持できるのか?それとも大多数のユーザーがコストがあまりにも惨烈だと気づいて、結局デフォルトでClaude Codeに戻るのか?

この2つの道は、まったく異なるエコシステムの景色につながります。ある開発者は補足しています。フレームワーク開発者が本当に必要としているのは、「含まれている」接続権ではなく、明確で予測可能なtokenクオータの制限だ。明確な境界があることで、むしろより良いプロダクト行動が生まれ、曖昧でグレーな領域は混乱しか生まないのだと。

ロウ・フーリーのこの投稿は、非常に先見性のある技術進化のシグナルであり、関連する議論も、現在のAIソフトウェアエンジニアリングの中核的な痛点を的確に捉えています。あとは、マーケット全体が「粗放に計算資源を燃やす」状態から「精緻化されたエンジニアリング・アーキテクチャ」へどう移行するかを見るだけです。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.24K保有者数:0
    0.00%
  • 時価総額:$2.23K保有者数:1
    0.00%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$0.1保有者数:0
    0.00%
  • 時価総額:$2.27K保有者数:2
    0.07%
  • ピン