MIT研究发现人工智能代理正在快速获得自主性和任务能力

(MENAFN-机器人与自动化新闻)据麻省理工学院的一项新研究项目显示,被称为“AI代理”的人工智能系统正变得越来越能够在最少人类监督的情况下执行复杂的数字任务。

由MIT研究人员编制的2025年AI代理指数分析了30个知名的代理型AI系统,并记录了它们的构建、部署和在软件生态系统中的使用方式。

根据该项目,“代理型AI系统在有限的人类参与下,越来越能够执行复杂任务”,反映出从简单的基于聊天的助手向能够直接与软件工具、网站和企业平台交互的系统的转变。

研究强调了这些代理现在在各种数字环境中的操作方式。一些代理可以直接操控网页——自动点击、打字和导航网站,而另一些则与企业软件平台(如客户关系管理(CRM)系统)交互。

例如,基于浏览器的代理在收到提示后可以自主在网络上执行任务,而企业代理则可以在发生事件时触发工作流程,例如接收电子邮件或检测数据库更新。

根据报告,浏览器代理可以“通过点击/打字/导航操作操控网页”,而企业工作流程代理通常通过系统集成(如CRM连接器)来更新记录或触发自动化流程。

一些代理还能在操作系统层面运行。面向开发者的工具可以直接在计算机上执行命令,包括编辑文件或通过命令行界面运行终端指令。

研究人员将代理分为三大类:基于聊天的助手、浏览器代理和企业自动化平台。聊天助手仍然是最常见的,占研究的30个系统中的12个,而13个是企业工作流程平台,五个主要通过浏览器界面操作。

研究还发现,这些类别之间的自主性水平差异显著。基于聊天的助手通常自主性较低,响应提示后执行单一操作,然后等待进一步指示。

相比之下,浏览器代理通常具有最高的自主性。一旦启动,它们可能在没有进一步人类输入的情况下完成整个操作序列。

企业代理处于中间地带。虽然用户通常手动配置它们,但一旦部署,它们可以运行由外部事件触发的自动化工作流程。

除了记录功能外,项目还发现代理生态系统中存在重大透明度缺口。研究人员检查了30个系统中的1350个信息字段,发现其中198个没有公开信息,特别是在安全和生态系统交互相关的领域。

研究还指出,大多数代理依赖少数几个基础AI模型家族,包括OpenAI、Anthropic和Google的系统。

随着代理技术不断扩展到网页浏览、软件自动化和企业运营,研究人员认为需要更好的文档和评估标准,以跟上这些系统快速发展的能力。

MIT研究人员未指出单一的主导AI代理平台。相反,研究表明, emerging代理生态系统的真正力量在于少数基础模型提供商——主要是OpenAI、Anthropic和Google——它们的模型支撑着目前在网络和企业软件中部署的大部分代理。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论