Dự đoán vòng loại trực tiếp World Cup, mức độ AI khác nhau lại chênh lệch nhiều như vậy?

robot
Đang tạo bản tóm tắt

原创 | Odaily 星球日报(@OdailyChina)

Tác giả | Asher(@Asher 0210)_

Trước mỗi trận đấu của World Cup, tôi đều cho AI dự đoán, hầu như mỗi mô hình đều nói rất có lý, đầy đủ chi tiết.

Có mô hình nói về giá trị đội bóng, có mô hình phân tích dữ liệu vòng bảng, có mô hình phân tích chấn thương và chiến thuật, còn có mô hình trực tiếp đưa ra kịch bản tỷ số, hiệp phụ, loạt sút luân lưu.

Thoạt nhìn, ChatGPT, Grok, Qwen, DeepSeek, Gemini, Claude đều rất hiểu bóng đá nhỉ.

Nhưng với tư cách là người dùng thị trường dự đoán, điều tôi thực sự quan tâm không phải là mô hình nào nói đầy đủ hơn, mà là mô hình nào đáng tham khảo hơn.

Khi World Cup bước vào giai đoạn loại trực tiếp, Odaily星球日报 bắt đầu từ trận đấu đầu tiên, trước mỗi trận đấu đã hỏi các mô hình AI khác nhau bằng các câu hỏi tương tự nhất có thể, và sau trận đấu đối chiếu với kết quả thực tế để xem lại – mô hình nào chỉ phân tích có vẻ đúng, mô hình nào thực sự đã nắm bắt được diễn biến trận đấu từ trước.

Hiện tại, các trận loại trực tiếp World Cup đã kết thúc, Canada 1-0 hạ Nam Phi, Brazil 2-1 thắng sít sao Nhật Bản, Đức bị Paraguay kéo vào loạt luân lưu và bị loại, Hà Lan cũng gục ngã dưới loạt luân lưu của Maroc.

Đến trận Bỉ vs Senegal, trận đấu còn diễn ra 2-2 rồi lội ngược dòng trong hiệp phụ, trực tiếp đẩy tính bất định của vòng loại trực tiếp lên cao nhất.

DeepSeek và Gemini, nhờ dự đoán trận Maroc mà trở nên xuất sắc


Điểm đáng nhớ nhất hiện tại vẫn là dự đoán của DeepSeek và Gemini về trận Hà Lan vs Maroc.

Trận này thực ra trước trận dễ đoán sai – Hà Lan có sức mạnh trên giấy tờ mạnh hơn, đội hình cũng đầy đủ hơn, nhiều mô hình biết Maroc không dễ chơi, nhưng cuối cùng vẫn tin Hà Lan có thể vượt qua.

Điểm mạnh của DeepSeek và Gemini là chúng không dừng lại ở bước "trận này sẽ rất giằng co", mà còn viết ra cả kịch bản phía sau.

Gemini trước trận trực tiếp đưa ra tỷ số 1-1 trong thời gian chính, Maroc thắng trong loạt luân lưu. Kết quả trận đấu thực sự hòa 1-1, cuối cùng Maroc thắng 3-2 trên chấm luân lưu loại Hà Lan. Không chỉ đoán đúng hướng, mà còn cả cách trận đấu bị kéo vào loạt luân lưu và ai cười cuối cùng đều cơ bản khớp.

Dự đoán của Gemini về trận Hà Lan vs Maroc

DeepSeek cũng rất gần.

Nó đánh giá trận này trong thời gian chính nhiều khả năng là 1-1 hoặc 0-0, trận đấu có thể kéo dài đến hiệp phụ thậm chí luân lưu, và nghiêng về Maroc nhờ phòng ngự và phản công để tạo bất ngờ đi tiếp.

Dự đoán của Deepseek về trận Hà Lan vs Maroc

Sau trận này, sự hiện diện của DeepSeek và Gemini trực tiếp tăng vọt. Đặc biệt là Gemini, lần này không giống như đang dự đoán trước trận, mà giống như đã xem trước kịch bản trận đấu.

Grok và Qwen liên tục đoán trúng tỷ số cụ thể, độ ổn định mạnh hơn tưởng tượng


Ngoài DeepSeek và Gemini tỏa sáng ở trận Maroc, Grok và Qwen cũng không phải không có sự hiện diện.

Điểm sáng nhất của chúng là trong một số trận đấu có hướng thắng thua tương đối rõ ràng, không chỉ đoán đúng đội vượt qua, mà còn dự đoán tỷ số cụ thể khá sát với kết quả cuối cùng.

Trận Nam Phi vs Canada là một ví dụ.

Trước trận, đa số mô hình AI đều đánh giá cao Canada, nhưng sự khác biệt nằm ở việc Canada có thắng dễ dàng hay không.

Grok trước trận đưa ra dự đoán Canada 1-0, Qwen cũng đưa ra thắng cách biệt một bàn. Cuối cùng Canada thực sự chỉ nhờ 1 bàn thắng để vượt qua, không tạo thành chiến thắng đậm như tưởng tượng.

Dự đoán của Qwen về trận Nam Phi vs Canada

Trận Brazil vs Nhật Bản cũng tương tự.

Phần lớn mô hình AI đều cho rằng Brazil mạnh hơn, nhưng liệu Nhật Bản có bám trụ được trận đấu hay không mới là chìa khóa của trận này.

Grok và Qwen đều dự đoán tỷ số là 2-1, cuối cùng trận đấu thực sự diễn ra Brazil 2-1 thắng sít sao.

Chúng không chỉ đoán đúng "Brazil sẽ thắng" đơn giản, mà là Nhật Bản có thể gây đủ khó khăn cho Brazil.

Trận Bờ Biển Ngà vs Na Uy, cả hai cũng đoán khá chính xác.

Na Uy có Haaland, hướng đi tiếp không khó hiểu, nhưng khả năng tranh chấp thể lực và tấn công biên của Bờ Biển Ngà cũng không khiến trận đấu trở nên một chiều.

Grok và Qwen đều dự đoán Na Uy thắng 2-1, cuối cùng tỷ số cũng rơi đúng vào "kịch bản" này.

Dự đoán của Gork về trận Bờ Biển Ngà vs Na Uy

Ưu điểm của Grok và Qwen là nhìn chi tiết hơn các trận có đội mạnh.

Chúng không viết trước kịch bản lớn như Maroc loại Hà Lan, nhưng trong các trận Canada, Brazil, Na Uy, Pháp, hướng thắng thua và điểm rơi tỷ số đều đưa ra khá sát.

Nói cách khác, chúng không nhất thiết là giỏi nhất trong việc bắt bất ngờ, nhưng rất giỏi trong việc đánh giá xem đội mạnh là vượt qua dễ dàng hay thắng sít sao.

ChatGPT không có nhiều tỷ số thần thánh, nhưng phân tích diễn biến trận đấu khá chính xác


ChatGPT không giống như Gemini đã dự đoán trước Maroc loại Hà Lan trên chấm luân lưu, cũng không giống như Grok, Qwen liên tục đoán trúng vài tỷ số cụ thể.

Nhưng ưu điểm của nó – nhiều trận trước trận có vẻ đội mạnh chiếm ưu thế, ChatGPT sẽ nhắc nhở rõ ràng hơn rằng trận này có thể không dễ dàng như vậy.

Trận Brazil vs Nhật Bản là một ví dụ.

ChatGPT dự đoán Brazil đi tiếp, nhưng không viết trận đấu là Brazil dễ dàng áp đảo, mà đề cập đến áp lực, chạy chỗ và kỷ luật của Nhật Bản sẽ khiến Brazil chơi không thoải mái, thậm chí có cơ hội ghi bàn trước hoặc gỡ hòa.

Trận Bờ Biển Ngà vs Na Uy cũng tương tự, ChatGPT dự đoán Na Uy đi tiếp, nhưng nói trước đây không phải trận dễ, khả năng tranh chấp thể lực, tấn công biên và chuyển đổi của Bờ Biển Ngà sẽ gây khó khăn.

Ngoài ra, trận loại trực tiếp Anh vs CHDC Congo, ChatGPT cũng không đơn giản viết Anh thắng đậm, mà cho rằng trận đấu có thể khá tẻ nhạt, CHDC Congo sẽ dùng phòng ngự số đông để kéo nhịp độ.

Cuối cùng Anh dù đi tiếp, nhưng thắng không dễ dàng.

Dự đoán của ChatGPT về trận Anh vs CHDC Congo

Điểm mạnh của ChatGPT, không phải là dự đoán tỷ số rất chính xác mỗi lần, mà là thường xuyên nói trước được khó khăn của trận đấu ở đâu.

Nó rất phù hợp để hiểu trận đấu, nhưng thích hợp với việc chỉ xem dự đoán một tỷ số cuối cùng.

Nó có thể nói về diễn biến khá chính xác, nhưng khi thực sự muốn viết ra một bất ngờ lớn, vẫn thiếu một chút quyết đoán.

Đức bị loại, trở thành cảnh lật xe tập thể của các mô hình AI


Nếu nói mấy trận trước có thể thấy điểm sáng riêng của từng mô hình, thì trận Đức vs Paraguay chính là một lần lật xe tập thể.

Trước trận, tất cả mô hình AI đều đứng về phía Đức.

ChatGPT, Grok, Qwen, Gemini, Claude tất cả đều nghiêng về Đức, dự đoán tỷ số chủ yếu tập trung ở 2-0, 3-0 hoặc 3-1.

Lý do cũng rất nhất quán: đều cho rằng Đức có sức mạnh trên giấy tờ mạnh hơn, chiều sâu đội hình tốt hơn, hỏa lực tấn công mạnh hơn.

Nhưng kết quả là trận này đã xảy ra vấn đề.

Các mô hình AI đã đánh giá thấp khả năng kéo trận đấu vào vũng lầy của Paraguay, Đức không thể giải quyết trận đấu trong thời gian chính, cũng không thể phá vỡ thế bế tắc trong hiệp phụ, cuối cùng bị Paraguay kéo vào loạt luân lưu và bị loại.

Hiện tại ai chính xác nhất?


Từ các trận loại trực tiếp đã kết thúc hiện tại, đặc điểm của các mô hình khác nhau bắt đầu lộ rõ.

DeepSeek và Gemini có nhiều điểm sáng nhất.

Chúng không chỉ dự đoán được các đội mạnh như Brazil, Pháp đi tiếp, mà còn trong những trận đấu bất ngờ khó đánh giá hơn, cũng đưa ra những câu trả lời có giá trị cao.

Trận Hà Lan vs Maroc, ưu điểm quan trọng nhất của chúng là dám viết trước kịch bản Maroc gây bất ngờ và loạt luân lưu.

Đặc biệt là Gemini, trực tiếp dự đoán Maroc thắng luân lưu, trận này thực sự rất nổi bật.

Grok và Qwen giống như những "tay chơi tỷ số".

Chúng đã trúng khá nhiều tỷ số cụ thể, đặc biệt trong các trận Canada, Brazil, Na Uy, Pháp thể hiện tốt.

Nhưng vấn đề là khi gặp các đội mạnh truyền thống như Đức, Hà Lan, cuối cùng vẫn nghiêng về đội cửa trên.

ChatGPT và Claude thì giống như những "tay chơi phân tích".

Lý do viết đầy đủ, hướng phần lớn không lạc, cũng có thể nhắc nhở một số rủi ro hiệp phụ.

Nhưng vấn đề là, chúng thường có thể nhận ra trận đấu khó chơi, nhưng không dám viết kết luận về phía bất ngờ.

Trận Hà Lan vs Maroc là như vậy, rõ ràng đã thấy nguy cơ hiệp phụ và luân lưu, nhưng cuối cùng vẫn tin Hà Lan hơn.

Vậy nên, thay vì vội hỏi mô hình nào hiểu bóng đá nhất, chi bằng xem chúng phù hợp với tình huống nào.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim