YCパートナー:モデルのサイズを競うよりも、AIを科学者のようにコードを書かせて自己進化させる方が良い

robot
概要作成中
据动察 Beating 监测,Y Combinator 合伙人 Diana Hu 在 X 上指出,相比单纯扩大参数规模,未来的前沿在于构建在基座模型之上的薄软件层,让 AI 像程序员一样自己编写解决问题的规则 (可执行世界模型)。AI 可以根据运行结果不断测试、修改并精简代码,而不需要对大模型本身进行昂贵的微调。

无梯度代码学习的路径,印证了 OpenAI 后训练核心成员翁家翌上个月提出的启发式学习 (Heuristic Learning) 范式。传统强化学习为了让 AI 学会一个任务,需要成千上万次调试,把经验强行压进神经网络这个黑盒里,耗能巨大且容易遗忘。而翁家翌的实验在不调整大模型任何参数的前提下,纯靠大模型自己写 Python 代码、找 bug 调规则,就刷满了 Atari 打砖块游戏。这表明知识的载体完全可以是人类可读、可测试的代码系统,而非看不懂的神经网络权重。

在 YC 联合创始人 Paul Graham 看来,写代码、验证并压缩的循环非常接近科学家的日常研究。大模型不需要重构大脑,而是像科学家一样,针对新环境用代码写出假设模型,运行代码进行验证实验,并提炼出最简洁的规则来解决问题。寻找最简程序的过程,也是 ARC-AGI 衡量人工智能效率的终极标准。

最关键的红利在于,无梯度学习可以直接乘上底层大模型能力提升的便车。底层大模型变得更聪明,智能体写出的代码和策略就会成倍变强。在理查德·萨顿 (Richard Sutton) 著名的惨痛的教训 (The Bitter Lesson) 之上,无梯度代码学习正在画出一条全新的 S 曲线。随着大模型代码能力的爆发,靠 AI 自我进化的路径正在拉开下一代人工智能范式的大幕。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし