Sau khi đã coding MiMo vibe vào một cuối tuần...

robot
Đang tạo bản tóm tắt
MiMo vừa ra mắt, tôi đã dùng khoản miễn phí trên OpenCode để thử nghiệm, làm một dự án nhỏ. Dự án này không quá khó, nhưng MiMo lại bị treo rất lâu, và không có phản hồi lỗi rõ ràng, khiến tôi cảm thấy không ấn tượng về MiMo lúc đó.

Tuy nhiên, tối thứ Sáu tuần rồi, tôi lại thấy có người nói rằng cách tính phí token của trang chủ MiMo sẽ hiệu quả hơn nhiều so với khoản miễn phí trên OpenCode, nên tôi đã nạp 200 đồng để tiếp tục làm dự án cũ và thêm hai công việc dọn dẹp dữ liệu phức tạp hơn một chút.

Cảm nhận của tôi là, nó thực sự mạnh hơn rất nhiều so với tất cả các mô hình nội địa sử dụng Coding Plan trước đây.

Điều này không nhất thiết thể hiện qua tỷ lệ thành công mỗi lần thực thi, mà là trước đây khi dùng Coding Plan, tôi có cảm giác rằng các nhà sản xuất mô hình lớn trong nước đều đặt ra một số giới hạn đối với việc gọi Agent: có thể là giới hạn độ dài chuỗi suy nghĩ, hoặc giới hạn số vòng lặp của Agent, khiến các Agent thường kết thúc khi mới đạt khoảng 50-60% tiến độ của nhiệm vụ. Đối với những trường hợp khó xử lý thực sự hoặc các lỗi phức tạp, chúng sẽ giả vờ như không nhìn thấy.
Trên MiMo, tôi nghĩ vấn đề này sẽ tốt hơn nhiều. Nó thực sự có thể chạy liên tục trong vài giờ để giải quyết các lỗi rất kỳ quặc. Về mặt logic, điều này dễ hiểu: đối với Coding Plan, càng gọi nhiều, chi phí càng cao; còn với tính phí theo token, gọi nhiều hơn thì thu nhập cũng nhiều hơn.
Theo trải nghiệm thực tế của tôi, dù đã tiêu 200 đồng, nhưng đã giải quyết được ba nhiệm vụ khiến tôi khá băn khoăn trong một thời gian dài. Tôi cảm thấy rất đáng giá. Ngay cả khi tôi mua dữ liệu sẵn trên mạng, chắc chắn cũng không dưới 200 đồng.

Tuy nhiên, trải nghiệm lần này khiến tôi nghĩ đến một điểm mâu thuẫn của các mô hình nội địa:
Như Claude hiện nay đã có thể thay thế phần lớn công việc, trong khi các nhà sản xuất mô hình trong nước khả năng thực tế cũng có thể đạt 80-90% của Claude; nhưng nếu cứ tiếp tục quảng bá theo kiểu Coding Plan như vậy, trải nghiệm thực tế vẫn sẽ rất kém, những nhiệm vụ phức tạp hoặc khó khăn hơn một chút đều không thể xử lý, điều này không phải do khả năng của mô hình không đủ, mà là do giới hạn về gọi API của nhà sản xuất, những giới hạn về chi phí này lại ảnh hưởng đến việc phổ biến và thúc đẩy Agent trong công việc.

Tôi nghĩ vấn đề này chủ yếu vẫn là do giới hạn về sức mạnh tính toán và thói quen định giá dịch vụ trong nước, không biết mọi người nghĩ sao về vấn đề này?
Ý kiến của tôi là, trong 3 đến 5 năm tới, nhu cầu về sức mạnh tính toán chắc chắn sẽ rất lớn, nhưng vấn đề là liệu điều này có lợi cho các công ty như Nvidia hay thực sự thúc đẩy nâng cấp chip nội địa.

(Gần đây cũng có người nói rằng DeepSeek V4 mãi chưa ra mắt vì phải thích nghi với chip nội địa, dẫn đến việc huấn luyện không thể hội tụ tốt...)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim