⚽ 預測世界盃,瓜分 $40,000!Gate 懂王集結令!
2026世界盃燃爆今夏,來 Gate 廣場當預言家,豪華獎池等您來戰!
💥 輕鬆兩步參與:
1️⃣ 帶 #广场预测世界杯赢40000U 發帖,或分享官方活動至廣場發帖
👉️ https://www.gate.com/competition/football-2026
2️⃣ 發帖內容可圍繞賽事結果預測、賽事勝率分析、交易策略/截圖分享等。
💰 三重大獎等您拿:
1️⃣ 日獎:每天評選 10 位“單日預測王”瓜分 $500!
2️⃣ 周獎:每周狂抽 50 名幸運分享錦鯉瓜分 $1,000!
3️⃣ 榜單獎:衝進周/月度排行榜,斬獲 Gate 世界盃限量球衣禮盒、預測市場體驗券!
詳情:https://www.gate.com/announcements/article/51597
GLM-5.2 是基準之王。
它是第一個在多個類別中獲得第一名的開放權重模型(並且在各方面都超越前沿模型)。
#1 獲勝:
→ 設計競技場:約1360 Elo,第一個獲得第一名的開放權重模型,超越 Fable 5 約10 Elo
→ Terminal-Bench 2.1:81.0%(最佳表現82.7%),第一個突破80%的開放模型
→ 人工分析智能指數 v4.1:頂尖開放權重模型,得分51
→ GDPval-AA v2:領先的開放權重,與 GPT-5.5 競爭或領先
→ LiveBench Agentic Coding:第1–2名的開放整體
前3名排名:
→ FrontierSWE(優勢):第3名,74.4%(接近 Opus 4.8 的75.1%,超越 GPT-5.5)
→ SWE-bench Pro:開放模型中的第一名,62.1%(超越 GPT-5.5 的58.6%)
→ MCP-Atlas(工具使用):約77.0,接近/排名前3
→ Humanity's Last Exam(含工具):約54.7,超越 GPT-5.5
→ BenchLM 排行榜:124個模型中的第3–4名
→ Code/Agent Arena(前端):#2 overall, behind only Fable →PostTrainBench: #整體第2名,落後於 Opus 4.8,超越 GPT-5.5
令人震驚的履歷。