MilesDeutscher

vip
币龄 3.6 年
最高 VIP 等级 2
用户暂无简介
每个人都应该在手机上设置一个提醒,强迫自己每个月重新审视这张图表。
如果你从未真正停下来仔细思考过它,现在就这样做吧。
让这成为你的提醒:时间是宝贵的,而你所剩的时间并没有你想象的那么多。
创办那家企业。环游世界。承担那个风险。
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
这是使用Hermes最强大的方式。
启动多个子代理来完成工作。
Hermes不是顺序工作,而是同时扩展到多个代理——然后交叉验证并合并结果。
就像从一个提示中获得整个团队:
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
Anthropic 的内部循环工程指南刚刚泄露了。
这是我今年读过的最有价值的 AI 指南。
这份指南信息量巨大,如果你想通过循环来最大化 AI 生产力,有五件事你需要知道(保存好这份指南):
1. 你应当围绕以下 5 个原则来构建每个循环:
• 发现 → 让代理自己找到工作(CI 失败、问题、提交)
• 交接 → 为每个任务分配独立的 git 工作树
• 验证 → 绝不让生成器自我评价
• 持久化 → 始终将状态写入磁盘(markdown 或看板)
• 调度 → 设置定时器,让你睡觉时它也能工作
2. 将生成器与评估器分离(最重要的规则)
使用两个代理:一个负责写,另一个是持怀疑态度的法官,默认代码有问题。
让评估器行动(运行测试、点击按钮、截图)——这才是真正阻止糟糕输出的方法。
3. 用以下 6 个部分构建:
• 自动化(定时器)
• 工作树(安全的并行处理)
• 技能(永久项目知识)
• 连接器(与 GitHub、Linear 等通信)
• 子代理(生成器 + 评估器)
• 记忆(在多次运行间持久化的状态文件)
4. 循环工程中必须注意的事项:
• 验证债务(使用验证代理)
• 失去对自己代码库的理解(必要时从头开始)
• Token 成本爆炸(解决方案见下)
• 认知放弃(不要因为“循环会处理”而停止思考)
5. 解决 Token 成本问题
循环工程可能会非常昂贵。
我建
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
机器人行业即将爆发。
为了帮助你进行研究,我打造了终极机器人技术 Claude 提示。
它将 Claude 连接到你的券商,扫描你当前的投资组合权重,并就如何投资机器人技术为你提供精确建议。
每个人都应该使用这个:
查看原文
  • 赞赏
  • 1
  • 转发
  • 分享
HighAmbition:
冲 🔥
进站休息。
然后继续建造世界上最大的人工智能帝国。
查看原文
post-image
post-image
post-image
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
机器人交易可能是未来十年最不对称的赌注。
机器人公司投资刚刚打破了历史新高(~$16B 并且还在攀升)。
以下是我正在关注的顶级机器人公司/股票,以期获得10倍回报(非财务建议):
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
很难想象,在大约12个月后,我们可能会拥有一个比Fable 5强大2倍的模型。
而且这可能是保守估计,届时模型成本也可能会便宜很多。
原因如下:
衡量AI能力的最佳单一指标是Epoch的能力指数(ECI)
(一个涵盖40多个基准测试的综合得分——数学、编程、
科学、推理)。
可以把它看作是前沿模型的智商测试。
当Fable发布时,它在ECI上达到了161的新高。
现在关键的部分来了:
前沿模型的改进速度在2024年4月左右几乎翻了一番,从每年约8分提高到15分。
自那以后,这个更快的速度在每个季度的测量周期中都保持了下来,并且成为了新趋势。
因此,理论上,自2024年以来保持的趋势只需在Fable 5之后的模型发布中继续下去,那么12个月后的最低水平将是模型能力提高2-3倍。
但最惊人的统计数据甚至不是能力曲线。
而是成本曲线:
在固定性能水平下运行AI模型的成本每两个月减半。
综合来看:
在12个月内,你不仅会拥有一个比Fable 5强大2倍的模型。
而且它会更便宜、更快,并且可能在你已有的硬件上运行。
我们还处于早期阶段。
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
人工智能的未来无疑是开源的。
对于99%的人来说,顶尖的开源权重模型已经能够处理你所有的日常需求。
在我看来,目前最好的做法是对你的AI使用采取一种“杠铃”策略:
初始的10%和规划阶段:使用前沿智能(Opus/GPT)
中段的80%繁重工作:切换到开源权重模型(GLM、Kimi)
最后的10%和复核:切换回前沿智能进行验证
两全其美——成本效益 + 智能。
查看原文
post-image
  • 赞赏
  • 1
  • 1
  • 分享
CryptoBoss1:
请回关 🙏
关于GPT-5.6的消息传出时,我心里一沉。
我们正式在AI发展上碰壁了,而这很可能就是戳破泡沫的那根针。
整个全球经济都押注在接下来的事态发展上。
没人把这些线索串联起来——让我来解释:
目前,整个经济都押注于一个赌注:
AI成功。
而几乎没人意识到这让我们暴露在多大的风险中。
2026年第一季度,AI资本支出约占美国GDP增长的75%,而企业预计今年仅在AI上就投入超过8000亿美元。
剔除AI支出,增长实际上为零。
危险之处在于:
政府刚刚开始对AI进行把关。
《寓言5》被下架,GPT-5.6的发布已延迟数周,如今政府想要“逐个客户”批准对前沿模型的访问权限。
如果政府继续限制AI,进步就会停滞(这已经发生)。
如果进步停滞,支出就会停滞。
如果支出停滞,约75%的GDP增长也会随之停滞。
整个经济变成了一场巨大的、押注于AI成功的高杠杆赌局。
这一切的讽刺之处在于,AI运行得太好、进展太快,以至于它自己成了瓶颈。
查看原文
  • 赞赏
  • 1
  • 转发
  • 分享
HighAmbition:
放手去做吧 👊
我2026年最好的投资:
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
你只需要一条推文就能在AI时代生存。
我最近坐下来,写下了在即将到来的人工智能时代生存的10条“规则”。
没有AI垃圾——只有我的真实想法。
如果你担心工作被取代,或AI带来的任何涟漪效应,希望你读读这个:
规则#1:要快
AI时代的首要技能是高行动力。信息不再是护城河。你的优势现在是速度。目标是成为一个迅速行动的人。
规则#2:创业
AI创造了如此多的商业机会。信息现在很丰富,你没有借口不去建立一个能产生现金流的生意。
规则#3:每天使用AI
成为AI原住民不再是可选项。把它融入你的生活,努力站在最前沿。
规则#4:情商 > 智商
当每个人都能使用相同的AI工具时,区分因素不再是智力,而是你与他人建立联系的能力。
规则#5:优先考虑健康
从简单的事情开始:睡眠、锻炼、补水和饮食。
规则#6:打造个人品牌
分发权是新的护城河。创作内容是免费的,也是最好的分发渠道。
规则#7:学会销售
这是没人谈论的技能。AI可以构建产品、撰写文案、设计网站、投放广告,但它仍然无法建立人与人之间的联系。
规则#8:投资
投资自己(技能)和AI(卖铲子的人)。这是我们有史以来最大的泡沫——好好利用它。
规则#9:建立人脉
建立你的人脉网络。你的人脉是你最终的安全网,也是你获得新机会的方式。
规则#10:保持好奇心
这是滋养以上所有技能的元技能。那些能快速学习和迭代的人,现在比以往任何时候都更有价值。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
GLM-5.2 是目前市场上最好的每次智能成本模型。
比 Claude 便宜大约 80%,但拥有大约 95% 的 Opus 4.8 智能水平。
价值惊人。
大多数人没有意识到这实际上是多么巨大的飞跃。
GLM-5.2:每百万令牌 5.80 美元,约 95% 的前沿智能
GPT-5.5:约 9.70 美元,92% 智能
Opus 4.8:约 23 美元,98% 智能
Fable 5:约 30 美元,100% 智能
在成本与智能的图表上绘制,GLM-5.2 正好位于你想要的位置:高智能,低成本。
这是第一个在价格的一小部分实现前沿性能的开源模型。
然而,我仍然采用“杠铃”策略(大多数人也应该这样做),经常使用 Claude 和其他前沿模型。
我的杠铃策略:
用 Opus 4.8 进行最初的 10% 规划。
用 GLM-5.2 进行便宜的 80%(繁重工作、初稿、重复任务)。
用 Opus 4.8 进行最后一步验证。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
你比你想象中更接近完全不同的生活。
只需要6个月。
到今年年底,你实际上可以过上梦想中的生活。
去争取你的那一份。
查看原文
post-image
post-image
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
GLM-5.2 是基准之王。
它是第一个在多个类别中夺冠的开源模型(并且在各方面都超越了前沿模型)。
#1 胜利:
→ 设计竞技场:约1360 Elo,首个夺冠的开源模型,胜过 Fable 5 约10 Elo
→ Terminal-Bench 2.1:81.0%(最佳表现82.7%),首个突破80%的开源模型
→ 人工分析智能指数 v4.1:顶级开源模型,得分51
→ GDPval-AA v2:领先的开源模型,与 GPT-5.5 竞争或超越
→ LiveBench 代理编码:整体排名第1–2
前列排名:
→ FrontierSWE(统治力):第3名,74.4%(接近 Opus 4.8 的75.1%,超越 GPT-5.5)
→ SWE-bench Pro:开源模型中第1,62.1%(超越 GPT-5.5 的58.6%)
→ MCP-Atlas(工具使用):约77.0,接近/位于前3
→ Humanity's Last Exam(带工具):约54.7,超越 GPT-5.5
→ BenchLM 排行榜:124个模型中的第3–4名
→ Code/Agent Arena(前端):#2 overall, behind only Fable →PostTrainBench: #整体第2,落后于 Opus 4.8,超越 GPT-5.5
令人震惊的履历。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
我使用 Fable 5 预测了世界杯冠军 *当比赛进行时*
并且我根据它的分析下注了10万美元。
我启动了一个 Fable 5 研究循环,分析了每一个历史数据点。
它花了30分钟研究球员记录、比赛历史、当前阵容等等。
根据 Fable:
西班牙、法国和英格兰占据了大约50%的世界杯获胜概率。
我在法国赢得全部冠军上下注了六位数(Fable 的第二选择)。
如果法国拿到奖杯,我将赢得+62.5万美元。
我从未用人工智能进行过如此大规模的投注。
我是不是在犯错误?
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
你为什么想变得富有 vs 为什么我想变得富有
查看原文
post-image
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
如何以一半的成本运行Fable级别的智能。
OpenRouter 最近部署了Fusion——世界上最智能的复合模型。
以下是你现在可以使用它的具体方法(在<60秒内设置):
1. 网络聊天界面(最快尝试)
访问:
用你的OpenRouter账户登录(免费开始,根据需要添加积分)。
点击“添加模型”并添加“Fusion”(在列表顶部)。
开始正常聊天。
2. 通过API
它兼容任何OpenAI的客户端。
前提条件:
- 创建一个免费账户在
- 生成一个API密钥(设置 → API密钥)
- 添加积分
设置非常简单,这也是你目前能获得的最接近Fable智能的方式。
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
想象在大约6个月后,我们可能会在开源模型中拥有类似 Fable 级别的智能,这简直不可思议。
开源人工智能现在比前沿的大型语言模型落后了4个月。
两年前是12。
按这个节奏,到今年年底,Fable 级别的智能将可以免费下载安装。
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
GLM-5.2 是我见过的最令人印象深刻的大型语言模型 *除了 Fable 5*
这个水平的智能现在开源,简直是疯狂的事情。
仅仅三个月前,这还被认为是世界上最强大的编码模型,如果 Fable 5 没有推出,它现在会是第一。
对于99%的人来说,这个模型可以处理你所有的日常任务,你再也不用担心你的工作流程被中断(就像 Fable 5 一样)。
对真正拥有自己智能的未来持乐观态度,这是一个巨大的飞跃。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享