中国证监会认证证券投资咨询机构(证书编号:ZX0118) | 客服电话:400-636-8688 | 投诉电话:0755-33189899

【行业跟踪】Operator和Manus打开AI Agent时代

摘要:AI Agent是人机交互新范式。

核心观点:

AI Agent是人机交互新范式。

AI Agent是能够感知环境、进行决策、执行动作的智能体,在2023已顺应大模型浪潮而生,随着多模态等技术逐步成熟,当前各厂商持续推出相关产品,Agent已开始逐步进入各个场景的工作流中,成为人机协同新范式。根据Roots Analysis预测数据,预计24年全球AI Agent市场规模为52.9亿美金,预计2035年达到2168亿美金,对应24-35年CAGR为40.15%。

OpenAI推出Operator,AI正式迈入Agent时代。

Operator由CUA新模型提供支持,其通过强化学习实现了GPT-4o的视觉能力与高级推理相结合,可以像人类一样完成与图形用户界面(GUI)的交互。Operator运行在浏览器中,在云端构建虚拟环境来执行操作,工作步骤主要分为感知、推理、执行。当前Operator测试数据优于前期SOTA,但与人类差距仍较大,目前仍在快速进步中。

Operator在多个场景应用已逐步显示潜力。

Operator 的一些典型应用场景包括:旅行预订、购物、餐厅预订、行政任务、市场营销、与各行业合作。OpenAI 正与 DoorDash、Instacart、OpenTable 和 Priceline 等公司合作,以改进 Operator 在现实世界中的应用。

中国团队推出全球首个通用AI Agent Manus,性能表现优异,与阿里千万达到合作。

Manus定位为全球第一款通用Agent,面对各类复杂多变的任务,Manus在自己的虚拟环境中灵活调用各类工具——编写并执行代码、智能浏览网页、操作各类网页应用——目标为用户直接交付完整的任务成果。在GAIA基准测试中,Manus在所有三个难度级别上都取得了新的最先进(SOTA)表现。目前Manus平台宣布将与阿里通义千问团队正式达成战略合作。

机会观点:

Agent能够分解执行用户指令,通过调用工具、生成代码等来完成任务,是业务+大模型的完美结合。C端Agent有望重塑流量入口,B端Agent将展现私域数据价值,落地行业Know-how。B和C两端Agent有望快速发展,看好AI应用。长期建议关注设备、材料、零部件的国产替代,AI技术驱动的高性能芯片和先进封装需求,及AI端侧应用带来的换机潮和硬件升级机会。

资料来源:东方财富Choice金融终端、国信证券《人工智能专题报告:Operator和Manus打开AI Agent时代》2025/03/12,山西证券《电子周跟踪:Manus推出全球首款通用型AI Agent,博通一季度业绩超预期》2025/03/13,德讯证顾整理时间:2025/03/14。

风险提示AI Agent成熟度发展不及预期;AI产业进步放缓;市场需求疲弱;下游IT开支放缓等。

一、 AI Agent将成为人机协同新范式

全球AI快速扩张,中美领先应用落地。

2022年,以ChatGPT为代表的大语言模型出现,掀起了全球AI浪潮。2023年开始,大模型的多模态能力显著增强,模型可用性进一步提升,推动全球AI行业快速扩张。在基础模型层面,据斯坦福大学数据,2023年共发布149个基础模型,为2022年的两倍,模型数量快速增加。据中国信通院数据,中美两国在AI领域中处于领先地位。

截至2024年,全球AI企业数量超3万家,其中美国企业超1万家,占比达34%,中国占全球的15%,位居第二。全球AI大模型数量为1328个(包含同一企业、同一模型的不同参数版本),美国的AI大模型数量占比44%,中国大模型数量占比为36%。随着大模型行业发展逐步成熟,厂商之间开始出现明显的价格竞争与市场份额抢占。

同时,DeepSeek等开源模型的性能快速提升,开源与闭源模型之间差距逐步缩小,进一步刺激了各模型应用成本下降。在上述因素推动下,用户与AI协作的条件逐渐成熟,AI应用有望在2025年于中、美两国快速发展。

国内外大模型调用价格持续下降

image.png 1

资料来源:OpenAI官网,谷歌官网,通义千问官网,国信证券经济研究所整理

中美AI企业处于领先地位

image.png 2

资料来源:中国通信院-《全球数字经济白皮书》-2023年-P29,国信证券经济研究所整理

AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。

不同于传统的人工智能,AI Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent和传统大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果,而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。

基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人类与AI协同的模式。

随着大模型的发展,人类与模型的协同方式从最初的聊天机器人转变为Copilot,并逐步向Agent探索。Agent的落地将给AI应用带来颠覆性变化,打开AI在垂直行业渗透的入口。随着自然语言处理、机器学习和生成式AI的进步,AI Agent的多功能性和部署量将急剧增长。

人类与AI交互方式转变

image.png 3

资料来源:头豹研究院,Frost & Sullivan,国信证券经济研究所整理

AI Agent将成为新一代智能交互范式。

AI Agent是能够感知环境、进行决策、执行动作的智能体,在2023已顺应大模型浪潮而生,随着多模态等技术逐步成熟,当前各厂商持续推出相关产品,Agent已开始逐步进入各个场景的工作流中。根据Gartner预测,到2028年至少15%的日常工作由AI Agent自主完成,33%的企业软件也将保护AI Agent。

AI Agent需要具备三大核心能力。

根据OpenAI前应用研究主管的经典定义,一个合规的Agent需要三大核心能力:规划,将复杂任务分解成一些列子步骤;工具使用,选取最合适的工具并熟练应用;记忆,既有短期记忆存储即时信息,又有长期记忆沉淀持久知识。目前Agent底层技术在持续进步,因此相关代表产品也在应运而生。

AI Agent持续提升,有望改变传统工作范式。

传统的工作范式是基于面向过程架构,以人为中心,AI为辅助,有固定形态的交互界面、预定义有限域的任务、信息分发平台等;基于AI Agent的工作范式基于面向目标架构,以AI为中心,人为辅助,变更为动态人机交互界面、无预限制有限域任务、知识和世界模型的分发平台等。

AI Agent市场处于早期阶段,商业化产品落地前夕。

目前,商业类AI Agent产品处于探索期,根据Y Combinator披露数据,24年冬季入营项目中,AI Agent项目占比接近80%,处于规模化应用前夕。根据Roots Analysis预测数据,预计24年全球AI Agent市场规模为52.9亿美金,预计2035年达到2168亿美金,对应24-35年CAGR为40.15%。国内AI Agent快速发展,根据华经产业研究院披露数据,23年中国AI Agent市场规模为59.81亿元人民币,预计24年将超过百亿元,市场规模快速增长。

24年全球AI Agent市场规模为52.9亿美金,预计35年达2168亿美金

image.png 4

资料来源:Roots Analysis,国信证券经济研究所整理

二、OpenAI 率先发布Operator智能体,AI进入Agent时代

OpenAI推出Operator智能体,模拟人类在电脑上的操作行为。

2025年1月OpenAI上线了其首个AI Agent Operator,Operator 能够模拟人类在电脑上的动作,如通过点击、滚动、输入等与电脑交互,并完成相关任务。Operator可以浏览网页、填写表格、订购商品、预定餐厅等,如输入餐厅预订要求后,Operator 会在分析需求后直接打开一个云端浏览器并执行搜索、查找、预定等相关操作。

Operator仍处于研究预览阶段。

Agent是AI产业当前进步重要方向之一,应用准确率仍待持续提升。为了确保安全和迭代进度,目前Operator处于研究预览阶段,仅面向美国的 ChatGPT Pro(200 美元/月)用户,Plus 用户也不能体验,未来将进一步扩展用户。

Operator代表OpenAI拉开L3级Agent时代序幕。

OpenAI内部将AI发展阶段定义为5个阶段:聊天机器人(具备对话能力)、推理者(具备人类问题解决能力)、Agent(具备执行任务能力)、创新者(具备创造发明能力)、组织者(具备组织工作能力)。Operator实现了AI与数字系统的交互,将自动执行桌面任务成为可能,而非调用固定API,Agent成为AI发展的新阶段。

CUA是Operator工作的主要Agent。

Computer-Using Agent(CUA)是一个计算机使用代理,其通过强化学习实现了GPT-4o 的视觉能力与高级推理相结合,可以像人类一样完成与图形用户界面 (GUI)的交互。CUA将高级 GUI 感知与结构化问题解决相结合,将任务分解为多步骤计划,且会在出现问题时自动纠错。

Operator测试数据优于前期SOTA,但与人类差距仍较大。

OSWorld是一个用于评估多模态Agent的测试集,WebArena是用于评估Agent浏览器使用性能的测试集。测评结果显示,Operator在 OSWorld上实现了成功率38.1%;WebArena 上实现了 58.1% 的成功率;在 WebVoyager 上实现了 87% 的基于 Web 的任务的成功率,但是 WebVoyager大多数任务都相对简单。目前Operator超过了前期最优水平,但相比人类72%以上的成功率仍有较大差距。

Operator仍在持续进步中。

目前Operator仍不完美,并且可能会犯错误。在内部测试数据,Operator在创建PPT和日历等复杂界面时会遇到挑战,在复杂的文本编辑方面表现较差 (成功率为 40%)。

Operator应用性能测试

image.png 5

资料来源:OpenAI官网,国信证券经济研究所整理

Operator已考虑了三层安全机制。

Operator运行在虚拟浏览器环境中,一方面是保证运行资源,一方面是可以建立多种安全机制。OpenAI进行了严格的安全设计,例如不能访问某些网站,叠加实时审核和检测系统,并进行了大量红队测试。目前Operator仍在根据真实的使用反馈在持续改进其安全性。

Operator未来计划三大进步方向。

第一,通过API使用CUA,公开为 Operator 提供支持的模型CUA,方便开发者构建自己的Agent。第二,继续提高 Operator 处理更长、更复杂的工作流程的能力。第三,计划将 Operator扩展到 Plus、Team 和 Enterprise 用户,在Operator达到一定安全性和可用性后,将其功能直接集成到 ChatGPT 中。

三、Operator已展现较多场景的应用潜力

OpenAI Operator 的一些典型应用场景包括:旅行预订、购物、餐厅预订、行政任务、市场营销、与各行业合作。

此外,OpenAI 正与 DoorDash、Instacart、OpenTable 和 Priceline 等公司合作,以改进 Operator 在现实世界中的应用。这意味着Operator 的功能将不断完善,并更好地满足不同行业用户的需求。

四、中国团队推出全球首个通用AI Agent Manus,性能表现优异

3月6日,来自中国的创业公司Monica正式对外发布通用型AI Agent产品Manus。

据团队介绍,“Manus是全球第一款通用Agent产品,可以解决各类复杂多变的任务。无论用户需要深入的市场调研、繁琐的文件批量处理、个性化的旅行规划还是专业的数据分析,Manus都能通过独立思考和系统规划,在自己的虚拟环境中灵活调用各类工具——编写并执行代码、智能浏览网页、操作各类网页应用——为用户直接交付完整的任务成果,而非仅仅提供建议或答案。”

Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越Open AI的同层次大模型。

GAIA为FAIR、Meta、HuggingFace等于2023年发布的通用人工智能助手基准测试,提出了系列需要推理、多模态处理、网页浏览和工具使用等基本能力的现实世界问题。对于人类来说,这些问题在概念上很简单,但对大多数先进的人工智能来说却具有挑战性:测试中人类受访者正确率达92%,而配备插件的GPT-4仅获得15%。GAIA可以根据解决问题所需的步骤数量和所需的不同工具数量分为三个难度级别:

1)Level 1:问题通常不需要工具,或最多使用一个工具,不超过 5 步;

2)Level 2:问题通常涉及更多步骤,大约在 5 到 10 步之间,且需要结合不同的工具;

3)Level 3:问题是为接近完美的通用助手设计的,需要执行任意长度的操作序列,使用任意数量的工具,并访问一般世界。

根据官方网站信息,在GAIA基准测试中,Manus在所有三个难度级别上都取得了新的最先进(SOTA)表现。除了基准测试,Manus还在Upwork(自由职业者服务平台)和Fiverr(同上)等平台上解决真实世界的问题,并在Kaggle竞赛(数据科学与机器学习竞赛平台)中有着出色表现。

在实际使用当中,目前Manus官网已提供多种处理现实世界任务的案例,包括个性化旅行规划(整合旅行信息、为用户创建定制旅行手册)、深度股票分析(全面股票洞察)、保险政策比较(创建保险政策比较表)、供应商采购(找到最适合用户需求的供应商)、财务报告分析(研究和数据分析捕捉市场对特定公司的情绪变化)、专业数据整理(创业公司列表整理)、教育内容创建(为中学教师创建视频演示材料)等。目前,该产品还在内测之中,用户可在登录后申请加入内测

Manus强调直接交付最终结果的能力,而非单纯回答问题。

Manus目前采用多代理架构(Multiple Agent),将复杂任务拆分为规划、执行、验证等子模块,运行在独立的虚拟机中,通过规划代理、执行代理、验证代理的分工协作机制来大幅提升对复杂任务的处理效率,并通过并行计算缩短响应时间。

在Multiple Agent架构中,每个代理可能基于独立的语言模型或强化学习模型,彼此通过API或消息队列通信。

同时每个任务也都在沙盒中运行,避免干扰其他任务,支持云端扩展。每个独立模型都能模仿人类处理任务的流程,比如先思考和规划,理解复杂指令并拆解为可执行的步骤,再调用合适的工具。Manus的这套多代理架构更像由多个助理通过协助的方式,分别完成检索资源、对接、验证信息是否有效等工作,来帮用户完成整个工作流程。

Manus背后的团队名为Monica.im。Monica是All-in-One的AI助手,产品形态从浏览器插件拓展至App、网页端,主流的使用场景是当用户在浏览器中点开它的小图标,就能直接使用其接入的各大主流模型。Monica团队本身并不自研大模型,而是基于业内大模型开发“套壳”产品,通过多模型动态调用(GPT-4、Claude3、Gemini)提升综合能力。目前,Manus没有透露背后调用的基础大模型的名字,推测也是不同大模型搭配使用。

与阿里达成合作,生态进一步扩张。

3月11日,Manus平台宣布将与阿里通义千问团队正式达成战略合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。目前两家技术团队已展开紧密协作,致力于为中国用户打造更具创造力的通用智能体产品,Manus产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。

基于Manus能力定位,推测其能力组合可拆解为以下模块:

1)Compute Use:类似Anthropic的Computer Use架构,允许AI在虚拟机中直接操作电脑(如浏览器、应用、代码),执行复杂任务;2)虚拟机:所有任务在独立虚拟机中运行;3)Artifacts:用户可以直接在生成内容的旁边进行修改,实时查看更改效果;4)内置多Agent协作:采用Multiple Agent架构,通过规划代理(Plan Agent)、执行代理(Execution Agent)、验证代理(Validation Agent)分工协作,实现任务闭环。

未来可能性:

Agent通常基于应用场景、个人习惯进行优化,而Manus定位为通用模型,这与Agent的使用理念存在矛盾。基于此,未来Manus可能会定位为新入口,整合市面上多种Agent、Compute use能力,然而整合工作量巨大,需要解决技术兼容性、数据隐私保护以及用户体验优化等诸多问题,可能会采用MCP的协议模式整合。

生态贡献:目前官方将计划在今年开源Manus中的部分模型,特别是Manus的推理(postering)部分,有望推动AI应用的落地,并带来AI算力更高的需求。

Manus能够在云端独立完成任务,无需人工干预,直接交付完整的任务成果,同时由多种模型支持,具备强大的工具调用能力,可灵活编写代码、智能浏览网页和操作各类应用。因此,Manus不仅仅局限于单一任务,而是能够跨领域、跨任务地提供解决方案,各家模型厂商有望内化Manus的通用任务执行能力,推出在多领域具有泛化应用效果的模型。同时,应用厂商亦可借鉴Manus开源的应用领域,对相关的模型落地方案进行优化,提升垂类应用模型的可用性及面对复杂任务时的准确度。Manus模式或将与AI搜索模式类似,成为AI应用方式的新路径。

五、机会观点

Agent时代的到来,标志着合理运用大模型,解决具体问题的“仿生人”产生。

Agent的意义可以简单理解为大模型“核心调度器”,或者“大模型路由器”。借助任务规划、数据存储和外部资源搜索能力,Agent能够分解执行客户的指令,并且能自制生成代码,并输出结果,为业务+大模型的深度融合。从Chatbot到Agent的演变,中间封装了多步Promot提示词环节,为具体场景Konw-how的智能化落地,不同行业、不同任务均有所不同。当前海外垂直Agent快速发展,国内Manus亦发布通用Agent,是未来AI发展解决实际问题的确定性方向。未来AI快速发展后,将覆盖下游领域,实现全面人机协同。

目前C端Agent正在重塑流量入口,很多现有App将变成工具,内嵌到更大的Agent中。垂直领域Agent也将快速丰富,B端Agent将对垂直私域数据进行智能体改造,让Kown-how的智能实现固化,这类Agent或将率先落地。

Agent发展打开了人机协同全新范式,将为AI应用提供新的发展思路。未来模型能力将持续提升、各领域Agent将成为模型触达终端用户的载体,持续看好AI应用后续发展,长期建议关注设备、材料、零部件的国产替代,AI技术驱动的高性能芯片和先进封装需求,及AI端侧应用带来的换机潮和硬件升级机会。

研究承诺

本报告所采用的数据均来自合法合规渠道,通过合理判断得出结论,独立、客观地出具本报告。承诺遵守国家法律、法规及证券监管机构、行业自律组织的各项规章制度,恪守独立诚信、谨慎客观、勤勉尽职、公正公平的原则,为投资者提供专业服务。

投资评级说明

评级标准

概念标的:相对强于市场基准指数收益率5%~15%之间;

中性:相对于市场基准指数收益率介于-5%~+5%之间;

回避:相对弱于市场基准指数收益率5%以上。

微信图片_20250108202154.png 6

未经允许不得转载:德讯证顾 » 【行业跟踪】Operator和Manus打开AI Agent时代

赞 (0)

评论 0

评论前必须登录!

登陆 注册