火山エンジンCoding Planが二重請求されていることが判明:表向きは回数で請求されているが、実際にはトークン消費に基づいて割引されている

robot
概要作成中

1M AI Newsのモニタリングによると、火山引擎方舟 Coding Planの課金方式には、ユーザーによって十分に開示されていない隠れた仕組みがあることが発見された。V2EXで、ある開発者が、割り当ての消費速度が他のプラットフォームの同種プランよりもはるかに速いと報告し、カスタマーサポートに問い合わせたところ、次のような返信があった:「1回のモデル呼び出しで消費されるTokensが、平均的な呼び出しの消費よりも大きい場合、当該期間に見込まれる利用可能回数は6,000回よりもはるかに少なくなる。」

Proプラン(200元/月)を例にすると、標称の割り当ては5時間あたり6,000回のリクエスト、週45,000回、月90,000回だ。しかし実際の課金は、1回の呼び出しごとに1回分を差し引くのではなく、1回あたりのトークン消費量を、複数回分の課金に換算して行われる。ユーザーが測算した換算式は usage = max(round(use_token / token_limit), 1) であり、モデルごとに隠れた倍率が異なる。DeepSeek-V3.2は約2倍、Doubao-Seed-2.0-Codeは約4倍、Doubao-Seed-2.0-Proは約6倍。つまり、Doubao-Seed-2.0-Proの1回の呼び出しが、配分消費として6回分に計上され得る。

このユーザーは例として、自身の1回の呼び出しが51万トークン消費されたが、AlibabaのBailianなど他のプラットフォームでは1回として計上される一方で、火山引擎では約20回に換算される可能性があるという。AIプログラミングAgentが複雑なタスクを実行する際、1回の呼び出しで10万、あるいは数十万トークンを消費することは常態であり、この課金方式ではプランの割り当てが急速に消耗されることになる。

国内のCoding Planプランは現在、一般的に呼び出し回数に基づいて課金されており、AlibabaのBailianやXiaomiのMiMoなどのプラットフォームは、1回の呼び出しごとに1回分を差し引き、トークンに換算しない。火山引擎のような「回数を標称し、トークンで換算する」二層の課金は業界内では比較的まれであり、プランページの目立つ位置でも説明されていない。ユーザーは、実際の消費が異常になってからカスタマーサポートに問い合わせて、この仕組みを初めて知ることになる。ByteDance傘下のAIプログラミングツールTraeも最近、純粋な回数課金から、これに類似したトークン換算による回数計上方式へ変更されたとユーザーから報告されている。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.23K保有者数:1
    0.00%
  • 時価総額:$2.26K保有者数:2
    0.07%
  • 時価総額:$2.22K保有者数:1
    0.00%
  • 時価総額:$2.23K保有者数:1
    0.00%
  • 時価総額:$2.23K保有者数:0
    0.00%
  • ピン