最近看到DeepMind创始人Hassabis在YC的一段访谈,有些观点挺扎心的。他说如果你现在启动一个十年期的深科技项目,必须把AGI在中途出现这件事纳入规划。这不是危言耸听,他个人的时间轴就是2030年左右。



听他讲技术细节才明白为什么AGI还差一两块拼图。大规模预训练、RLHF、思维链这些技术已经被验证了,他很确定它们会成为AGI最终架构的一部分。但持续学习、长程推理、记忆的某些方面还没真正解决。现在的做法基本是把所有东西往上下文窗口里塞,这相当粗暴。他举例说,一百万token的上下文窗口看起来很大,但如果要处理即时视讯串流,其实只够20分钟的数据。想让系统理解你一两个个月的生活,远远不够。

推理的问题更有意思。他常拿Gemini下棋来观察,发现它有时候意识到某步棋不好,但找不到更好的选择,结果还是走了那步臭棋。精确的推理系统不应该这样。这就是为什么会看到所谓的「锯齿状智慧」——能解IMO金牌级的题,卻能被小学数学难住。

Agent这块他坦言我们才刚起步。要达到AGI,必须有个能主动帮你解决问题的系统,这就是Agent的路。但现在还在实验阶段,大多数场景下还是锦上添花。他提到还没看到有人用AI工具做出过登顶应用商店排行榜的3A游戏,按照当前投入的算力和工具,理论上应该可能,但还没发生。说明流程或工具上还缺点什么。他预计未来6到12个月内会看到这样的成果。

有趣的是,小模型正在改变整个游戏规则。他们的Flash模型能达到前沿模型95%的效果,但成本只有十分之一。蒸馏这套方法本来就是DeepMind发明的,现在仍然是世界顶尖。而且他们有极大的动力去优化——Google每个产品都在整合Gemini,涉及数十亿用户。这意味着必须速度极快、效率极高、成本极低。他不觉得已经碰到了信息理论上的极限,一个前沿模型发布后,半年到一年内它的能力就能被压缩到边缘设备上运行的模型里。

关于科学应用,Isomorphic Labs进展很好,AlphaFold只是药物发现流程中的一个环节。他们的终极目标是做出完整的虚拟细胞,一个可以施加扰动的全功能细胞模拟器。估计距离完整虚拟细胞还有大约十年,现在从虚拟细胞核开始做。

对创业者最实用的建议是,追难问题和追简单问题难度其实差不多,只是难的方式不同。人生有限,不如把精力砸在你不做就真没人做的事情上。另外未来几年跨领域组合会更普遍,AI会让跨领域变得更容易。但最关键的是,认真对待AGI时间表,想象那个世界会是什么样,然后建立一个在那个世界到来时仍然有用的东西。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论