曾主导自进化大模型研究,腾讯AI西雅图前高级研究员于文豪加入OpenAI

robot
摘要生成中

据动察 Beating 监测,原腾讯 AI 西雅图实验室高级研究员于文豪已于上月正式加入 OpenAI,担任 AGI 研究员(AGI Researcher)。他在领英确认将参与塑造下一代 AI 模型,为构建 AGI 做出贡献。

于文豪于 2023 年获得圣母大学计算机科学博士学位,过去两年的核心研究方向为大模型的强化学习后训练、推理与 Agent。他在学术界已累计发表 30 余篇顶会论文,引用量超 5700 次,曾获 EMNLP 2023 杰出论文奖。在腾讯期间,他曾主导提出 R-Zero 训练范式,探索让模型在没有人类标注数据的情况下,通过互相生成难题进行博弈对战,从而实现能力的自我进化。此外,他主导的智能体项目 WebVoyager 曾被 OpenAI、谷歌等机构采用。

于文豪在大模型自我博弈(Self-play)和智能体领域的深厚积累,高度契合 OpenAI 当前利用强化学习提升模型推理能力的战略重点。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论