MiMoがリリースされた直後、私はOpenCodeの無料枠を使って試してみました。小さなプロジェクトを作成しましたが、このプロジェクト自体の難易度は高くありませんでした。しかし、MiMoは長い間動作が安定せず、明確なエラーも返さず、当時はMiMoに対してあまり良い印象を持っていませんでした。しかし、金曜日の夜に、MiMoの公式サイトのトークン課金方式はOpenCodeの無料枠よりもはるかに効果的だという話を聞き、200元をチャージして、以前のプロジェクトと少し複雑なデータクリーニング作業を続けて行いました。私の感想としては、確かに以前の中国製モデルの中でCoding Planを使ったものよりもはるかに優れていると感じました。これは単に一回の実行成功率が高いことを示すわけではなく、以前Coding Planを使っていたときには、中国製大規模モデルのベンダーはエージェントの呼び出しに何らかの制限をかけていると感じていました。例えば、思考チェーンの長さを制限したり、エージェントの実行回数を制限したりして、タスクの50%から60%の段階で終了させることが多かったのです。そうした制限のため、処理が非常に難しいコーナーケースや複雑なバグには目をつぶることになっていました。一方、MiMoではこの問題がかなり改善されていると感じます。実際に数時間にわたってしっかりと動作し、難しいバグを解決するために使えるのです。論理的には非常に理解しやすいもので、Coding Planの場合、呼び出し回数が増えるほどコストが高くなるのに対し、トークン課金では呼び出し回数が増えるほど収益も増える仕組みです。私の実際の使用例では、200元を使っても、長い間困っていた3つのタスクを解決できました。個人的には非常に価値があったと感じています。既存のデータをネットで買えば、確実に200元以上のコストがかかるでしょう。しかし、この体験を通じて、中国製モデルの矛盾点も見えてきました。 例えば、Claudeの最先端モデルはすでに多くの仕事を代替できるレベルに達していますし、国内のモデルベンダーの能力もClaudeの80%から90%に近づいています。しかし、もし引き続きCoding Planのような方式で普及させると、実際の使用体験はかなり劣るままで、少し複雑または扱いにくいタスクには対応できません。これはモデルの能力不足ではなく、呼び出し制限によるコストの問題です。このコスト制限は逆にエージェントの普及や展開にも悪影響を及ぼします。この問題の根本は、計算能力の制約と、国内のサービス型課金の価格設定の習慣にあると思います。皆さんはこの点についてどう考えますか? 私の考えでは、今後3〜5年の間に計算能力の需要は非常に高まるでしょうが、問題はそれがNVIDIAのような企業にとって追い風になるのか、それとも国内のチップのアップグレードを促進するのかという点です。(最近では、DeepSeek V4の開発遅延も、国内チップへの適応が必要なため、訓練がうまく収束しないという話もあります。)
MiMo vibe codingで週末を過ごした後...
MiMoがリリースされた直後、私はOpenCodeの無料枠を使って試してみました。小さなプロジェクトを作成しましたが、このプロジェクト自体の難易度は高くありませんでした。しかし、MiMoは長い間動作が安定せず、明確なエラーも返さず、当時はMiMoに対してあまり良い印象を持っていませんでした。
しかし、金曜日の夜に、MiMoの公式サイトのトークン課金方式はOpenCodeの無料枠よりもはるかに効果的だという話を聞き、200元をチャージして、以前のプロジェクトと少し複雑なデータクリーニング作業を続けて行いました。
私の感想としては、確かに以前の中国製モデルの中でCoding Planを使ったものよりもはるかに優れていると感じました。
これは単に一回の実行成功率が高いことを示すわけではなく、以前Coding Planを使っていたときには、中国製大規模モデルのベンダーはエージェントの呼び出しに何らかの制限をかけていると感じていました。例えば、思考チェーンの長さを制限したり、エージェントの実行回数を制限したりして、タスクの50%から60%の段階で終了させることが多かったのです。そうした制限のため、処理が非常に難しいコーナーケースや複雑なバグには目をつぶることになっていました。
一方、MiMoではこの問題がかなり改善されていると感じます。実際に数時間にわたってしっかりと動作し、難しいバグを解決するために使えるのです。論理的には非常に理解しやすいもので、Coding Planの場合、呼び出し回数が増えるほどコストが高くなるのに対し、トークン課金では呼び出し回数が増えるほど収益も増える仕組みです。
私の実際の使用例では、200元を使っても、長い間困っていた3つのタスクを解決できました。個人的には非常に価値があったと感じています。既存のデータをネットで買えば、確実に200元以上のコストがかかるでしょう。
しかし、この体験を通じて、中国製モデルの矛盾点も見えてきました。
例えば、Claudeの最先端モデルはすでに多くの仕事を代替できるレベルに達していますし、国内のモデルベンダーの能力もClaudeの80%から90%に近づいています。しかし、もし引き続きCoding Planのような方式で普及させると、実際の使用体験はかなり劣るままで、少し複雑または扱いにくいタスクには対応できません。これはモデルの能力不足ではなく、呼び出し制限によるコストの問題です。このコスト制限は逆にエージェントの普及や展開にも悪影響を及ぼします。
この問題の根本は、計算能力の制約と、国内のサービス型課金の価格設定の習慣にあると思います。皆さんはこの点についてどう考えますか?
私の考えでは、今後3〜5年の間に計算能力の需要は非常に高まるでしょうが、問題はそれがNVIDIAのような企業にとって追い風になるのか、それとも国内のチップのアップグレードを促進するのかという点です。
(最近では、DeepSeek V4の開発遅延も、国内チップへの適応が必要なため、訓練がうまく収束しないという話もあります。)