从离开 OpenAI 到“杠上”五角大厦:Anthropic 兄妹档如何为 AI 画下红线,避免文明崩溃

彭博专访 Anthropic 创始人,揭秘与 OpenAI 的决裂及「安全第一」的使命。面对与五角大厦的合约冲突、大规模失业预警及强大模型 Mythos 带来的威胁。
(前情提要:Claude有80%程序码是自己写的,Anthropic呼吁「全球设计煞车机制」玩真的?)
(背景补充:Anthropic执行长Dario Amodei:再6-12个月,中国开源AI模型就能追上 Mythos)

本文目录

切换

  • 第一章:指数级增长的规律与愿景
  • 第二章:从旧金山童年到与 OpenAI 的决裂
  • 第三章:定义 AI 的道德与「宪法」
  • 第四章:企业布局与失业危机
  • 第五章:五角大厦的红线与 Mythos 模型
  • 第六章:如何面对 25% 的毁灭概率?
  • 结语

在AI 的军备竞赛中,Anthropic 被视为 OpenAI 最强大的竞争对手,且已有领先的势头。这家由 OpenAI 前高管 Dario Amodei 与 Daniela Amodei 兄妹档于 2021 年创立的公司,从一开始就标榜着「AI 安全」的旗号,旗下开发的 Claude 在业界赢得极高评价。

然而随着时间推移,Anthropic 也陷入了权力与伦理的漩涡。从与五角大厦的合约纠纷,到足以摧毁网络安全的超级模型「Mythos」,这对兄妹档正站在改变人类文明的风口浪尖。

彭博社资深记者 Emily Chang 亲自走访 Anthropic 旧金山总部,深入了解这家估值近兆美元公司的核心愿景、内部矛盾以及对未来的恐惧,以下为影片重点整理。

第一章:指数级增长的规律与愿景

Emily Chang: 我很喜欢这个图书馆。你是个大书虫吗?

Dario Amodei: 这里确实非常漂亮。整体来说,我读很多书,但老实说,在过去一年左右的时间里,我几乎没有什么闲暇时间了。

Emily Chang: 你们的产品更新得如此频繁且快速,是怎么做到的?

Dario Amodei: 我们在整个产品开发周期中都使用 Claude(自家模型)。这让我们能够以极快的速度发布。

Dario Amodei: 这种指数的感觉是:一开始好像什么都没发生,然后是一些小事发生,接着——砰!它就疯狂地爆发了。我观察这个规律很久了,我心里想:「是的,我们很可能在某个时刻成为营收最高、估值最高的 AI 公司。」而这确实发生了。我们始终在思考:如何训练好的模型?如何将它们转化为好的产品?

最重要的是,如何确保一切是安全的。

第二章:从旧金山童年到与 OpenAI 的决裂

Emily Chang: 聊聊你在旧金山的童年吧。你的父亲是皮革工匠,母亲在图书馆工作,这对你有什么影响?

Dario Amodei: 当时第一次网络革命正在发生,但我完全没兴趣。我只对数学、理解宇宙和科幻小说感兴趣。我对世界充满了强烈的好奇心。

Daniela Amodei(Anthropic 总裁): Dario 从小就非常聪明。他初中就在修微积分,高中就在伯克利大学修数学课。我则倾向于阅读和艺术,我们在性格上几乎是完美的互补。

备注:2016 年,Dario 加入了刚成立的 OpenAI,Daniela 也随后于 2018 年加入。Dario 在那里开发了著名的「缩放定律」,预言只要增加数据和算力,模型就会变得更聪明。这项理论为 ChatGPT 的成功铺平了道路。但在 2021 年,Amodei 兄妹选择离开,这已成为硅谷的传说。

Emily Chang: 你们离开 OpenAI 的决定已经成为硅谷的「神话」了。你们到底在什么问题上产生了分歧?

Dario Amodei: 关于「安全」问题,有很多合理的意见分歧。但分歧本身不足以让人离开。真正的核心在于「信任」。当你觉得对方的价值观与他口中所说的不符,当你觉得对方不诚实时,你就很难再合作下去。与其和没有共同愿景的人争论,不如去做你自己的事。

第三章:定义 AI 的道德与「宪法」

Emily Chang: Claude 有一种非常独特的风格与人性化的名字。你们想传达什么?

Daniela Amodei: 我们称之为「职业温暖」(Professional Warmth)。目标不是让它成为你最好的朋友,而是让它既亲近又保持专业的距离感。

Emily Chang: 你们提到要教导 Claude 「变好」。什么是好的模型?什么又是坏的?

Daniela Amodei: 我们不希望模型说谎——无论是无意还是有意的,我们称之为「幻觉」。我们也必须确保模型不会故意试图欺骗用户。在定义「好」与「坏」时,虽然没有全球统一标准,但我们使用了《联合国人权宣言》等创始文件来训练它。

有趣的是,我们甚至开始与宗教领袖对话,探讨如何将人类几千年来共同守护的核心价值植入模型。

第四章:企业布局与失业危机

Emily Chang: 为什么选择专注于企业与编码?

Dario Amodei: 商业模式必须与价值观一致。社群媒体的世界是由广告和成瘾驱动的。而在企业领域,AI 可以治愈疾病、优化能源。这更符合我们的目标。

Boris Cherny(Claude 代码负责人): 以前工程师需要手动写代码,现在 Claude 写代码,我负责指挥。我有如拥有了喷射背包,工程师的角色正发生翻天覆地的变化。我个人 100% 的代码都由 Claude 撰写。

Emily Chang: 但这引发了担忧。你曾预测 AI 可能取代一半的初级白领工作。现在还是这个看法吗?

Dario Amodei: 我依然非常担忧。目前 AI 让人更高产,但当自动化接近 100% 时,人类该去做什么?这是不舒服的事实。我们必须思考全民基本收入(UBI)或政策干预。

Daniela Amodei: 我稍微乐观一点。我认为人类会找到利用 AI 的新方式,而人之间的互动(如医学诊断中的床边关怀)是 AI 永远无法取代的。

第五章:五角大厦的红线与 Mythos 模型

Emily Chang: 媒体报道 Claude 被用于针对伊朗的军事行动,甚至在委内瑞拉的行动中被采用。

Dario Amodei: 我是一个爱国者,我认为我们需要保护民主免受威权威胁。但我划下了红线:Claude 不能被用于「大规模监控」或「全自动武器」。当五角大厦要求移除安全护栏时,我们拒绝了。即便被政府黑名单或被指控为「左翼疯子」,我们也绝不退让。

Emily Chang: 那么关于「Mythos」模型呢?听说它强大到让外界感到恐惧。

Dario Amodei: Mythos 发现了几乎所有主流操作系统的漏洞。测试过它的公司称之为「超级武器」。

Emily Chang: 你们决定谁能使用它,谁不能。这种权力的集中难道不令人担忧吗?

Daniela Amodei: 这确实很复杂。我们必须在「防止它被用来入侵银行、窃取机密」与「让它帮助防御者」之间寻找平衡。我们不希望重蹈社群媒体的覆辙,等到出错了才去道歉。

第六章:如何面对 25% 的毁灭概率?

Emily** Chang:** 你曾提到人类文明有 10% 到 25% 的崩溃概率。为什么你觉得你们能处理这种压力?

Dario Amodei: 我通过「绝对的透明」来处理压力。我每两周就会在全体员工面前演讲一小时,无所不谈。这建立了信任,也让我不觉得孤单。

许多人将推动核武发展但随后呼吁军控的奥本海默与这些 AI 先驱相提并论。但 Dario 认为,奥本海默在某种程度上是个「失败的案例」。

Emily Chang: 你最认同的历史人物是谁?奥本海默(Oppenheimer)吗?

Dario Amodei: 我更认同里奥·西拉德(Leo Szilard),他是第一个想到链式反应的人。奥本海默某种程度上是一个失败的案例,因为他没有建立起足够的制衡机制。我们需要的是制衡。

Emily Chang: 在这一切疯狂的中心,你如何寻找宁静?

Dario Amodei: 坦白说,就是「暴露疗法」。有时我会和 Daniela 或妻子一起玩游戏,或者去意大利看我们的马「卡里普索」(Calypso)。它对 AI 一无所知,它只是一匹快乐的马。这就是我的禅。

结语

Emily Chang: 你们正在建立一个无比强大的技术,且将从中获利。我们为什么要信任你们?

**Dario Amodei:**怀疑是理所当然的。硅谷失去了很多信任。信任不能靠说的,必须靠做的。如果这群人都做不到(守住底线),那可能就没人能做到了。我们无法保证成功,但我们可以保证我们会拼尽全力。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论