Elon Musk: Mô hình lớn của Trung Quốc sẽ bắt kịp Anthropic Fable vào Quý 1 năm 2027! Zhìpǔ Tángjié: Không cần phải dùng lâu như vậy

Tesla CEO Elon Musk đã trả lời trên X vào thứ Năm về cuộc thảo luận "Bao giờ mô hình lớn Trung Quốc mới bắt kịp trình độ Fable của Anthropic" và đưa ra dự kiến thời gian: "Có thể vào quý 1 năm 2027." Người sáng lập trí tuệ nhân tạo Zhipu, Tang Jie, ngay lập tức phản bác lại "Không thể mất quá lâu như vậy."
(Thông tin trước: Anthropic công bố các mô hình Claude Fable 5 và Claude Mythos 5)
(Thông tin bổ sung: Tổng lượng mô hình AI lớn toàn cầu sử dụng đạt 44,6 nghìn tỷ Token, mô hình Trung Quốc đứng đầu bảng trong 7 tuần liên tiếp)

Tóm tắt chính

  • Musk dự đoán vào ngày 18 tháng 6 trên X rằng mô hình lớn Trung Quốc sẽ vào khoảng quý 1 năm 2027 bắt kịp trình độ Fable của Anthropic
  • Người sáng lập Zhipu, Tang Jie, phản hồi "Không thể mất quá lâu," ngụ ý có thể đạt mục tiêu sớm hơn
  • Musk nhấn mạnh ngoài benchmark, "trí tuệ thực dụng" mà Anthropic tập trung sẽ thể hiện rõ trong doanh thu

CEO Tesla Elon Musk lại tham gia tranh luận trên X. Vào thứ Năm, một cuộc thảo luận của người dùng hỏi "Bao giờ mô hình lớn Trung Quốc mới đạt trình độ của Fable thuộc về Anthropic," Musk đưa ra dự đoán: "Có thể vào quý 1 năm 2027."

Câu nói này nhanh chóng nhận được phản hồi từ một trong số những người liên quan, sáng lập trí tuệ nhân tạo Zhipu, Tang Jie, trực tiếp đáp lại: "Không mất nhiều thời gian như vậy."

Musk tiếp tục phản hồi, nói rõ hơn: "Về tiêu chuẩn benchmark, đúng; nhưng nếu đánh giá dựa trên tính thực dụng thực sự, thì ngay cả quý 1 cũng sẽ rất ấn tượng."

Không biết từ khi nào, hai nhà sáng lập các công ty mô hình AI này đã dự đoán tốc độ tiến bộ của các mô hình Trung-Mỹ.

Chiến thắng benchmark không đồng nghĩa với chiến thắng thực sự

Musk sau đó bổ sung một nhận định quan trọng hơn. Ông nói rằng, Anthropic đúng đắn khi tập trung tối đa vào "trí tuệ thực dụng," điều này sẽ không phản ánh trong điểm số benchmark, nhưng chắc chắn sẽ thể hiện rõ trong doanh thu.

Anthropic đúng đắn khi tập trung tối đa vào tối đa hóa trí tuệ thực dụng, điều này sẽ không thể hiện trong các bài kiểm tra benchmark, nhưng chắc chắn sẽ thể hiện trong doanh thu.

Nói cách khác, Musk đang chuyển tiêu chuẩn đánh giá từ bảng xếp hạng điểm số sang báo cáo tài chính. Việc mô hình có thể "làm đẹp" bảng xếp hạng là một chuyện, còn việc khiến người dùng sẵn sàng bỏ tiền ra sử dụng mới là chuyện khác.

Zhipu GLM-5.2 vừa ra mắt

Bối cảnh của cuộc đối thoại này là cả Trung Quốc và Mỹ đều có những động thái mới. Claude Fable 5 của Anthropic được công bố vào ngày 9 tháng 6, thuộc dòng Mythos hàng đầu của công ty, gần như dẫn đầu tất cả các bài kiểm tra benchmark AI, đặc biệt trong bài kiểm tra SWE-bench Pro đo lường khả năng kỹ thuật thực tế, đã vượt qua ngưỡng 80%.

Ở phía Trung Quốc, Zhipu ngày 17 tháng 6 vừa công bố mô hình flagship GLM-5.2, nhấn mạnh khả năng xử lý dài 1 triệu token không mất mát, khả năng lập trình nâng cao, và hỗ trợ nền tảng tính toán nội địa Day0 ra mắt. Sự tự tin của Tang Jie khi đáp lại "Không mất nhiều thời gian như vậy" bắt nguồn từ đây, cổ phiếu Zhipu tăng vọt, phần nào cũng mang lại nhiều tự tin cho ông.

Các câu hỏi thường gặp

Musk nghĩ bao giờ mô hình lớn Trung Quốc mới bắt kịp Fable của Anthropic?

Musk dự đoán vào ngày 18 tháng 6 trên X khoảng quý 1 năm 2027. Nhưng ông bổ sung, đó là dựa trên benchmark; nếu đánh giá dựa trên tính thực dụng thực sự, mô hình Trung Quốc có thể đạt đến mức ấn tượng sớm hơn. Người sáng lập Zhipu, Tang Jie, phản hồi "Không mất nhiều thời gian như vậy."

Fable của Anthropic là trình độ như thế nào?

Fable 5 được công bố vào ngày 9 tháng 6, là mô hình Mythos hàng đầu của Anthropic, gần như dẫn đầu tất cả các bài kiểm tra benchmark AI. Trong bài kiểm tra SWE-bench Pro đo lường khả năng kỹ thuật thực tế, đã vượt qua 80%, được xem là một trong những mô hình mạnh nhất hiện nay, trở thành tiêu chuẩn để Trung Quốc bắt kịp.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim