介绍 | 全球首位AI软件工程师Devin,已在Upwork完成真实项目

robot
摘要生成中

认知(Cognition)是一家位于美国的应用型人工智能实验室,已揭示其声称为“世界首个AI软件工程师”的成果。根据其创建者的说法,该被命名为Devin的AI代理已成功应对了由知名AI公司举办的真实工程面试。

据称,Devin还完成了在Upwork上发布的真实工作。Upwork是一个基于美国的自由职业平台。

*“Devin是一位不知疲倦、技艺娴熟的队友,既随时准备与你并肩构建,也能在你需要审阅时独立完成任务。有了Devin,工程师可以专注于更有趣的问题,而工程团队则可以努力追求更雄心勃勃的目标,”*公司官网博客文章中写道。

该AI代理具备先进的软件开发能力,包括编程、调试、问题解决等。Devin利用机器学习算法持续学习并提升其性能,在新挑战出现时进行适应。简而言之,Devin可以从头到尾构建并实现应用程序,并且还能训练与精炼自身的AI模型。

Devin能够规划并执行复杂的工程任务,这类任务通常涉及成千上万的决策。这种能力得益于认知在长期推理与规划方面的进展。据公司称,Devin可以在每个阶段检索相关上下文,随着时间的推移实现自主学习,并在需要时纠正错误。

在SWE-Bench基准测试上(用于评估大型语言模型在GitHub上发现的真实世界软件问题中的表现),Devin在没有任何协助的情况下正确解决了13.86%的问题,而此前最先进模式在未协助与已协助情况下的正确率分别为1.96%和4.80%。

尽管公司已详细阐述Devin的能力,但一些专家表示担忧:这名AI软件工程师在处理复杂需求或依赖人类直觉与创造力的场景时,可能会遇到挑战。此外,像Devin这样的AI工具也引发了对潜在工作岗位被替代的担忧。

尽管如此,一些人认为,Devin可能会成为众多软件工程师的有价值伙伴,在人类创造力与AI之间打开新的协作机会。

关注我们的Twitter以获取最新帖子和更新

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论