🍀 Spring Appointment, Lucky Draw Gifts! Growth Value Issue 1️⃣7️⃣ Spring Lucky Draw Carnival Begins!
Seize Spring Luck! 👉 https://www.gate.com/activities/pointprize?now_period=17
🌟 How to Participate?
1️⃣ Enter [Plaza] personal homepage, click the points icon next to your avatar to enter [Community Center]
2️⃣ Complete plaza or hot chat tasks like posting, commenting, liking, and speaking to earn growth value
🎁 Every 300 points can draw once, 10g gold bars, Gate Red Bull gift boxes, VIP experience cards and more great prizes await you!
Details 👉 https://www.gate.com/announcements/article/
保密式 AI 基准(ARC-AGI-X):对加密市场影响不大
头条
沃顿商学院学者 Ethan Mollick 提出"保密式"ARC-AGI-X 基准,希望更公平地评估 AI 模型
摘要
Ethan Mollick(沃顿副教授、《Co-Intelligence》作者、2024 TIME100 AI 入选者)在社交媒体上提出"ARC-AGI-X"基准的想法:让可信第三方托管测试,题目和题型都不公开,排行榜公开但测试内容保密,防止模型专门针对测试题训练。他的核心想法是,通过改进评估方法,真正衡量通用智能的进展,而不是继续奖励堆规模和"背答案"的做法。
分析
现有 ARC-AGI 基准由 François Chollet 在 2019 年提出,用新颖的网格谜题测试"流体智力"。人类准确率超过 85%,而 AI 系统(即使到 2026 年的 ARC-AGI-3)仍然低于 50%。差距的原因:
Mollick 的思路是用"保密题库 + 外部专家验证"来防止"教到考点",迫使模型在推理和泛化上真正进步。这针对的是一个老问题:公开题库让模型"看起来更强",但未必有真正可迁移的能力。
2025 年 ARC Prize 的结果也说明了这一点:
可能的影响:
关键信息:
影响评估
结论: 对加密交易者和短期资金来说,这个话题目前不相关;真正的受益者是专注 AI 评测和模型能力验证的研究者。如果你是加密市场的主动交易者,现在不需要行动;长期配置者可以被动跟踪,等"AI 评测机制影响到加密 AI 赛道"的信号出现再说。