Mythos 预览把行业拉回防守:DeFi 安全基本盘动摇,AI 资源涌向风控赛道

robot
摘要生成中

Mythos 让 AI 行业转向防守:几个关键问题浮出水面

Deedy Das 那条推文不只是引发讨论,更是把整个行业从"模型有多强"拉回到"强模型能干什么、该怎么管"。根据公开信息,Mythos Preview 在 BenchLM 拿了 99/100,代理任务满分,SWE-bench 编码基准约 94%,明显高于 Claude Opus 4.6。据报道,这个模型用不到 50 美元算力就定位到一个 27 年前的 OpenBSD 漏洞,还能自己串起 Linux 内核漏洞链。Karpathy、LeCun 这些人还没公开表态,可能是因为模型还没对独立研究者开放。

我的判断:行业注意力正在从"能力爬榜"转向"防御和管控"。 Anthropic 通过 Project Glasswing 搞有限准入,想先把双重用途问题处理好再说。

  • 企业准入制造了资源和信息鸿沟:Glasswing 已经拉进 40 多家合作方(Apple、Microsoft 都在),配了 1 亿美元额度做安全场景;开源项目很难拿到同等资源。
  • DeFi 的安全假设正在被动摇:链上合约锁着大约 2000 亿美元。Solana 上 Drift 损失 2.85 亿美元后,STRIDE 安全计划才上线。AI 漏洞发现工具越来越强,那些没做形式化验证的协议会被存款人用更狠的风险定价来审视。
  • 资金跟着"负责任 AI"走:Anthropic G 轮后隐含估值约 3800 亿美元,说明投资者偏好安全取向。RSP 3.0 能不能真正阻止滥用,还得观察。

跑分不是全部:上不上线看安全门槛和可控性

企业采购看的是"能不能安全上线",不是榜单排名。泄露后网络安全板块回撤 5–10%,加上同行没人公开反驳,都说明市场在"能力"之外更看重"防御/风控"。

视角 依据 变化 评估
能力导向 BenchLM 99/100、代理任务第一,内部测试展示 Firefox 漏洞链 开发者对 AI 编码/代理工作流预期抬升 可能被高估;生产环境可靠性和分数是两回事
安全优先 Glasswing 联盟、零日发现(比如 16 年前的 FFmpeg 漏洞) 基础设施脆弱点被关注,AI 辅助安全审计在推进 被低估;Anthropic 作为安全伙伴的可信度上升,竞品很难追上
市场谨慎 安全股回调、Solana 上 2.85 亿美元损失 投资者在 6–18 个月维度重新掂量扩散风险 短期合理;长期防御型技术可能有超额回报
安全门槛 RSP 评估没触达自治阈值、但模型还没公测 合规行业偏好审计过的模型和受控发布 框架有效;对研究者不友好,但合规买方喜欢

共识在收敛:与其问"AI 还能做什么",不如问"怎么让它在边界内做事"。

关键信息

  • Mythos 能力强但只给企业试点:高分基准加上真实零日样本,再加企业级早期准入,形成了"高能力 + 严控访问"的组合。
  • DeFi 风险在被重新定价:高价值合约面对 AI 攻防提速,形式化验证和 AI 安全审计会从加分项变成准入门槛
  • 资金和叙事联动:资本、人才往"可控的强模型"聚集,开放生态和独立研究的处境越来越边缘。
  • 上线决策逻辑在变安全门槛、隔离能力、可审计性正在取代"榜单分数"成为企业采购的主要考量。

重要性:高
分类:模型发布|AI 安全|市场影响

结论:企业和资金端已经在给 Anthropic 的防守定位买单;不重视安全集成的 Builder、没有企业通道的研究者,边缘化风险在上升。

判断:从叙事角度看,现在仍处于"偏早但在加速"的阶段;最受益的是有安全能力和合规渠道的 Builder 与机构资金。二级交易者应该多观察安全落地和准入格局的变化,对只持有开放生态敞口的参与者来说,这个局面并不友好。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论