📢 Gate 廣場 TradFi 交易分享挑戰上線!
晒单瓜分 $30,000 獎池,新人首帖 100% 中獎!
📌 參與方式:
帶 #TradFi交易分享挑战 發帖,滿足以下任一即可:
🔹 帶今日指定 TradFi 幣種標籤發帖交流。
🔹 完成單筆大於 $10U 的 TradFi CFD 交易並掛載交易卡片。
🏷️ 今日指定標籤:USDJPY、AUDUSD、US30、TSLA、JPN225
🎁 寵粉福利:
1️⃣ 卡片分享獎: 抽 50 人,每人送 $100 仓位體驗券!
2️⃣ 發帖榜單獎: 衝排行榜,贏 WCTC 限定 T 恤!
3️⃣ 新粉見面禮: 新人首次發帖,100% 領 $10 體驗券!
詳情:https://www.gate.com/announcements/article/51221
AI 能取代金融分析師?Vals AI新版測試全軍覆沒,GPT 5.5準確率勉強過半
與單輪問答不同,該測試要求模型在數百頁的 10-K 和 10-Q 財報中自主尋找相關段落,處理跨年份財務報表調整,並帶著精確的中間數字完成多步計算。Vals AI 透露,如果採用「必須完全答對」的嚴格評分標準,所有前沿模型的準確率全部跌破 40%;在最難的「財務建模」和「先例分析」類別中,最高分僅有 23%。
在其他模型方面,Kimi K2.6 以 44.87% 排在第五,是得分最高的國產模型;緊隨其後的是 GLM 5.1(44.79%)和 DeepSeek V4(44.08%)。此外,官方將「最快速度」標籤授予了 Claude Opus 4.7(單次耗時 360 秒),GLM 5.1 則拿下了「最省預算」標籤(單次成本 0.62 美元)。
這次測試得分的集體下挫(上一代測試中 Opus 4.7 得分為 64.4%)證明了一點:目前的 AI 已經可以搞定簡單的檢索,但在需要遵守特定行業慣例、且對數字精準度要求極高的金融深水區,還遠遠無法取代人類分析師。