消費者推論のジレンマ:
フロンティアAPIの高コストに対処するために、多くの消費者志向の推論プロジェクトが動いています
方法はさまざまですが、前提はOpenRouterのような集約者に比べて安価な推論を提供することです
ここでの課題はタイミングの問題です
今日、消費者は非常に補助されたフロンティアAIを利用しています
消費者がSOTA推論プランを$10から利用できる選択肢がたくさんあり、$200/月のプランは驚くほど多くの使用量を提供しています
これらのサブプランの存在を考えると、APIの従量課金推論に対する消費者の需要はそれほど高くありません
*企業は別の話です
したがって、これらの消費者志向のプロジェクトの重要な仮定は、いずれ補助金がなくなるということです
多くはサブプランがより高価になるか、ラボが制限を縮小し、最終的にほとんどの人がAPI請求に移行することを予想しています
典型的な罠と切り替えです
しかし、これらの変化がいつ起こるかは全く未知数です
したがって、ビルダーにとっては、仮定は正しいかもしれませんが、タイミングが早すぎる可能性もあります
この分野で成功している最良のプロジェクトは、高ボリュームの消費者API推論以外のユースケースでPMFを見つけつつ、もし/いつ罠と切り替えが起きても低コストの提供者となるための能力を
原文表示