亚马逊周一发布了Nova Act,这是一款能够控制网络浏览器并独立执行简单操作的通用AI代理。同时推出的还有Nova Act SDK,允许开发人员使用Nova Act构建代理原型。

Nova Act由亚马逊在旧金山新设立的AGI实验室开发,这也将为该公司即将推出的Alexa+(亚马逊语音助手的生成式AI增强版)提供关键功能。不过目前发布的Nova Act版本被定位为"研究预览版",开发人员可通过nova.amazon.com网站访问Nova Act工具包。

亚马逊推出Nova Act:进军AI代理市场的新举措

这一产品是亚马逊与OpenAI的Operator和Anthropic的Computer Use竞争的明确举措。多家科技巨头都认为,能为用户导航网络的AI代理将大幅提升当前AI聊天机器人的实用性。虽然亚马逊并非该领域的先行者,但通过Alexa+,它的覆盖范围可能成为最广泛的。

据亚马逊介绍,开发人员使用Nova Act SDK可实现为用户自动执行基本操作,如网上订餐或预订。该工具包支持整合多种功能,让AI代理浏览网页、填写表格或在日历上选择日期。

亚马逊声称Nova Act在内部测试中表现优于竞争对手。在ScreenSpot Web Text评估中,Nova Act得分94%,超过了OpenAI的CUA(88%)和Anthropic的Claude3.7Sonnet(90%)。然而,亚马逊并未使用WebVoyager等更常见的代理评估对Nova Act进行基准测试。

Nova Act是由前OpenAI研究员David Luan和Pieter Abbeel共同领导的AGI实验室的首个公开产品。两人都曾创立自己的AI创业公司——Luan创办了Adept,Abbeel共同创办了Covariant——去年被亚马逊聘请领导其AI代理工作。

Luan告诉TechCrunch,他认为代理是创建超级智能AI系统的关键一步,他将AGI定义为"能够帮助完成人类在计算机上所做一切的AI系统"。他表示团队设计Nova Act SDK的目标是可靠地自动执行简短任务,并让开发人员能够精确定义何时需要人工干预工作流程。

早期AI代理面临的主要挑战是跨领域可靠性。在的测试中,现有系统普遍速度慢、难以长时间独立运行,且容易犯人类不会犯的错误。市场将很快看到亚马逊是否突破了这些限制,或者其代理是否也存在困扰竞争对手的同样问题。