📢 Gate 广场认证创作者招募中,入驻瓜分每月 $20,000 创作大奖!
📌 参与方式
站内创作者: 成功申请“创作者认证徽章”即可自动参与。
新入驻创作者: 需填写入驻表单申请 👉️ https://www.gate.com/questionnaire/7698
🎁 创作者福利
1️⃣ 首帖见面礼: 新入驻/回归创作者发首帖,即得 $50U 奖励!
2️⃣ 周度发帖奖: 完成周发帖任务,轻松瓜分 $10,000 奖池!
3️⃣ 月度创作奖: 赛道更多样,完成月度任务瓜分 $1,600 GT 奖池!
4️⃣ 专属推广任务:进入专属创作者社群,享专属推广任务和节日礼包!
让您的优质内容被更多人看到,携手共建高质量创作者社区!
活动细节:https://www.gate.com/announcements/article/51536
从离开 OpenAI 到“杠上”五角大厦:Anthropic 兄妹档如何为 AI 画下红线,避免文明崩溃
彭博专访 Anthropic 创始人,揭秘与 OpenAI 的决裂及「安全第一」的使命。面对与五角大厦的合约冲突、大规模失业预警及强大模型 Mythos 带来的威胁。
(前情提要:Claude有80%程序码是自己写的,Anthropic呼吁「全球设计煞车机制」玩真的?)
(背景补充:Anthropic执行长Dario Amodei:再6-12个月,中国开源AI模型就能追上 Mythos)
本文目录
切换
在AI 的军备竞赛中,Anthropic 被视为 OpenAI 最强大的竞争对手,且已有领先的势头。这家由 OpenAI 前高管 Dario Amodei 与 Daniela Amodei 兄妹档于 2021 年创立的公司,从一开始就标榜着「AI 安全」的旗号,旗下开发的 Claude 在业界赢得极高评价。
然而随着时间推移,Anthropic 也陷入了权力与伦理的漩涡。从与五角大厦的合约纠纷,到足以摧毁网络安全的超级模型「Mythos」,这对兄妹档正站在改变人类文明的风口浪尖。
彭博社资深记者 Emily Chang 亲自走访 Anthropic 旧金山总部,深入了解这家估值近兆美元公司的核心愿景、内部矛盾以及对未来的恐惧,以下为影片重点整理。
第一章:指数级增长的规律与愿景
Emily Chang: 我很喜欢这个图书馆。你是个大书虫吗?
Dario Amodei: 这里确实非常漂亮。整体来说,我读很多书,但老实说,在过去一年左右的时间里,我几乎没有什么闲暇时间了。
Emily Chang: 你们的产品更新得如此频繁且快速,是怎么做到的?
Dario Amodei: 我们在整个产品开发周期中都使用 Claude(自家模型)。这让我们能够以极快的速度发布。
Dario Amodei: 这种指数的感觉是:一开始好像什么都没发生,然后是一些小事发生,接着——砰!它就疯狂地爆发了。我观察这个规律很久了,我心里想:「是的,我们很可能在某个时刻成为营收最高、估值最高的 AI 公司。」而这确实发生了。我们始终在思考:如何训练好的模型?如何将它们转化为好的产品?
最重要的是,如何确保一切是安全的。
第二章:从旧金山童年到与 OpenAI 的决裂
Emily Chang: 聊聊你在旧金山的童年吧。你的父亲是皮革工匠,母亲在图书馆工作,这对你有什么影响?
Dario Amodei: 当时第一次网络革命正在发生,但我完全没兴趣。我只对数学、理解宇宙和科幻小说感兴趣。我对世界充满了强烈的好奇心。
Daniela Amodei(Anthropic 总裁): Dario 从小就非常聪明。他初中就在修微积分,高中就在伯克利大学修数学课。我则倾向于阅读和艺术,我们在性格上几乎是完美的互补。
备注:2016 年,Dario 加入了刚成立的 OpenAI,Daniela 也随后于 2018 年加入。Dario 在那里开发了著名的「缩放定律」,预言只要增加数据和算力,模型就会变得更聪明。这项理论为 ChatGPT 的成功铺平了道路。但在 2021 年,Amodei 兄妹选择离开,这已成为硅谷的传说。
Emily Chang: 你们离开 OpenAI 的决定已经成为硅谷的「神话」了。你们到底在什么问题上产生了分歧?
Dario Amodei: 关于「安全」问题,有很多合理的意见分歧。但分歧本身不足以让人离开。真正的核心在于「信任」。当你觉得对方的价值观与他口中所说的不符,当你觉得对方不诚实时,你就很难再合作下去。与其和没有共同愿景的人争论,不如去做你自己的事。
第三章:定义 AI 的道德与「宪法」
Emily Chang: Claude 有一种非常独特的风格与人性化的名字。你们想传达什么?
Daniela Amodei: 我们称之为「职业温暖」(Professional Warmth)。目标不是让它成为你最好的朋友,而是让它既亲近又保持专业的距离感。
Emily Chang: 你们提到要教导 Claude 「变好」。什么是好的模型?什么又是坏的?
Daniela Amodei: 我们不希望模型说谎——无论是无意还是有意的,我们称之为「幻觉」。我们也必须确保模型不会故意试图欺骗用户。在定义「好」与「坏」时,虽然没有全球统一标准,但我们使用了《联合国人权宣言》等创始文件来训练它。
有趣的是,我们甚至开始与宗教领袖对话,探讨如何将人类几千年来共同守护的核心价值植入模型。
第四章:企业布局与失业危机
Emily Chang: 为什么选择专注于企业与编码?
Dario Amodei: 商业模式必须与价值观一致。社群媒体的世界是由广告和成瘾驱动的。而在企业领域,AI 可以治愈疾病、优化能源。这更符合我们的目标。
Boris Cherny(Claude 代码负责人): 以前工程师需要手动写代码,现在 Claude 写代码,我负责指挥。我有如拥有了喷射背包,工程师的角色正发生翻天覆地的变化。我个人 100% 的代码都由 Claude 撰写。
Emily Chang: 但这引发了担忧。你曾预测 AI 可能取代一半的初级白领工作。现在还是这个看法吗?
Dario Amodei: 我依然非常担忧。目前 AI 让人更高产,但当自动化接近 100% 时,人类该去做什么?这是不舒服的事实。我们必须思考全民基本收入(UBI)或政策干预。
Daniela Amodei: 我稍微乐观一点。我认为人类会找到利用 AI 的新方式,而人之间的互动(如医学诊断中的床边关怀)是 AI 永远无法取代的。
第五章:五角大厦的红线与 Mythos 模型
Emily Chang: 媒体报道 Claude 被用于针对伊朗的军事行动,甚至在委内瑞拉的行动中被采用。
Dario Amodei: 我是一个爱国者,我认为我们需要保护民主免受威权威胁。但我划下了红线:Claude 不能被用于「大规模监控」或「全自动武器」。当五角大厦要求移除安全护栏时,我们拒绝了。即便被政府黑名单或被指控为「左翼疯子」,我们也绝不退让。
Emily Chang: 那么关于「Mythos」模型呢?听说它强大到让外界感到恐惧。
Dario Amodei: Mythos 发现了几乎所有主流操作系统的漏洞。测试过它的公司称之为「超级武器」。
Emily Chang: 你们决定谁能使用它,谁不能。这种权力的集中难道不令人担忧吗?
Daniela Amodei: 这确实很复杂。我们必须在「防止它被用来入侵银行、窃取机密」与「让它帮助防御者」之间寻找平衡。我们不希望重蹈社群媒体的覆辙,等到出错了才去道歉。
第六章:如何面对 25% 的毁灭概率?
Emily** Chang:** 你曾提到人类文明有 10% 到 25% 的崩溃概率。为什么你觉得你们能处理这种压力?
Dario Amodei: 我通过「绝对的透明」来处理压力。我每两周就会在全体员工面前演讲一小时,无所不谈。这建立了信任,也让我不觉得孤单。
许多人将推动核武发展但随后呼吁军控的奥本海默与这些 AI 先驱相提并论。但 Dario 认为,奥本海默在某种程度上是个「失败的案例」。
Emily Chang: 你最认同的历史人物是谁?奥本海默(Oppenheimer)吗?
Dario Amodei: 我更认同里奥·西拉德(Leo Szilard),他是第一个想到链式反应的人。奥本海默某种程度上是一个失败的案例,因为他没有建立起足够的制衡机制。我们需要的是制衡。
Emily Chang: 在这一切疯狂的中心,你如何寻找宁静?
Dario Amodei: 坦白说,就是「暴露疗法」。有时我会和 Daniela 或妻子一起玩游戏,或者去意大利看我们的马「卡里普索」(Calypso)。它对 AI 一无所知,它只是一匹快乐的马。这就是我的禅。
结语
Emily Chang: 你们正在建立一个无比强大的技术,且将从中获利。我们为什么要信任你们?
**Dario Amodei:**怀疑是理所当然的。硅谷失去了很多信任。信任不能靠说的,必须靠做的。如果这群人都做不到(守住底线),那可能就没人能做到了。我们无法保证成功,但我们可以保证我们会拼尽全力。