После кодирования с MiMo vibe в выходные...

robot
Генерация тезисов в процессе

MiMo только что вышел, и я сразу использовал бесплатный лимит на OpenCode для эксперимента, создал небольшой проект. Сам по себе этот проект несложный, но MiMo зависает очень долго, и при этом не было явных ошибок или обратной связи, поэтому у меня сложилось плохое впечатление о MiMo.

Однако в пятницу вечером я снова увидел, что кто-то говорит, что способ оплаты токенов на официальном сайте MiMo работает гораздо лучше, чем бесплатный лимит на OpenCode, поэтому я пополнил счет на 200 рублей и продолжил работу над своим первоначальным проектом и двумя более сложными задачами по очистке данных.

Мое ощущение — он действительно намного лучше всех отечественных моделей, использующих Coding Plan.

Это не обязательно проявляется в высокой успешности однократных запусков, а скорее в том, что при использовании Coding Plan я чувствовал, что отечественные крупные модели ограничивают вызовы агента: возможно, ограничена длина цепочки размышлений или количество раундов выполнения агента, из-за чего такие агенты склонны завершать задачу на 50-60%, игнорируя сложные крайние случаи или сложные баги. Они будто бы не замечают их.
На MiMo я считаю, что эта проблема значительно лучше решена. Он действительно может стабильно работать несколько часов, чтобы исправить очень сложные баги. Логика понятна: при использовании Coding Plan чем больше вызовов, тем выше стоимость; а при оплате по токенам — чем больше вызовов, тем больше доход.

Что касается моего личного опыта, я потратил 200 рублей, но решил три задачи, которые меня очень долго мучили. Я считаю, что это вполне оправдано. Даже если бы я покупал готовые данные в интернете, это стоило бы не менее 200 рублей.

Однако этот опыт заставил меня задуматься о противоречии внутри отечественных моделей:
Например, сейчас топовые модели вроде Claude уже могут заменить большую часть работы, а отечественные модели по возможностям достигают примерно 80-90% Claude; но если всё продолжать продвигать через Coding Plan, реальный пользовательский опыт всё равно будет значительно хуже — более сложные или запутанные задачи они не смогут решить. Это не из-за недостатка модели, а из-за ограничений на вызовы, которые накладывают производители. Эти ограничения в стоимости, в свою очередь, негативно влияют на популяризацию и распространение агента в реальных задачах.

Я считаю, что основная проблема — это ограничения вычислительных мощностей и привычки ценообразования внутри страны на платные услуги. Интересно, что вы об этом думаете?
Лично я считаю, что в ближайшие 3–5 лет спрос на вычислительные ресурсы останется очень высоким, но вопрос в том, будет ли это выгодно для таких компаний, как NVIDIA, или действительно поможет развитию отечественных чипов.

(Недавно кто-то сказал, что DeepSeek V4 долго не выходит из-за необходимости адаптации к отечественным чипам, что мешает хорошему сходимости обучения…)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить