您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能专题报告:Operator和Manus打开AIAgent时代 -慈喀SEO百科
当前位置:首页/行业研究/报告详情/

人工智能专题报告:Operator和Manus打开AIAgent时代

信息技术2025-03-12熊莉、库宏垚国信证券张***
人工智能专题报告:Operator和Manus打开AIAgent时代

证券研究报告2025年3月12日 人工智能专题报告: Operator和Manus打开AIAgent时代 行业研究行业专题计算机:人工智能 投资评级:优于大市 证券分析师:熊莉xiongli1guosencomcn证券投资咨询执业资格证书编码:S0980519030002证券分析师:库宏垚kuhongyaoguosencomcn证券投资咨询执业资格证书编码:S0980520010001联系人:云梦泽yunmengzeguosencomcn 报告摘要 AIAgent是人机交互新范式。AIAgent是能够感知环境、进行决策、执行动作的智能体,在2023已顺应大模型浪潮而生,随着多模态等技术逐步成熟,当前各厂商持续推出相关产品,Agent已开始逐步进入各个场景的工作流中,成为人机协同新范式。根据RootsAnalysis预测数据,预计24年全球AIAgent市场规模为529亿美金,预计2035年达到2168亿美金,对应2435年CAGR为4015。 OpenAI推出Operator,AI正式迈入Agent时代。Operator由CUA新模型提供支持,其通过强化学习实现了GPT4o的视觉能力与高级推理相结合,可以像人类一样完成与图形用户界面(GUI)的交互。Operator运行在浏览器中,在云端构建虚拟环境来执行操作,工作步骤主要分为感知、推理、执行。当前Operator测试数据优于前期SOTA,但与人类差距仍较大,目前仍在快速进步中。 Operator遵守严格的数据使用和法律要求。OpenAI在数据使用上,除了公开和用户提供的信息之外,还有较多的第三方公司合作。美国法律对OpenAI在数据访问的隐私保护、数据安全、版权、特定领域数据保护等均有要求,Operator也提供了较为严格的安全措施。 Operator在多个场景应用已逐步显示潜力。Operator的一些典型应用场景包括:旅行预订、购物、餐厅预订、行政任务、市场营销、与各行业合作。OpenAI正与DoorDash、Instacart、OpenTable和Priceline等公司合作,以改进Operator在现实世界中的应用。 中国团队推出全球首个通用AIAgentManus,性能表现优异,与阿里千万达到合作。Manus定位为全球第一款通用Agen,面对各类复杂多变的任务,Manus在自己的虚拟环境中灵活调用各类工具编写并执行代码、智能浏览网页、操作各类网页应用目标为用户直接交付完整的任务成果。在官方演示中,Manus展现了其筛选简历、遴选房产、股票分析等多种应用场景。在GAIA基准测试中,Manus在所有三个难度级别上都取得了新的最先进(SOTA)表现。目前Manus平台宣布将与阿里通义千问团队正式达成战略合作。 投资建议:维持“优于大市”评级。Agent能够分解执行用户指令,通过调用工具、生成代码等来完成任务,是业务大模型的完美结合。C端Agent有望重塑流量入口,B端Agent将展现私域数据价值,落地行业Knowhow。B和C两端Agent有望快速发展,看好AI应用。 风险提示:AIAgent成熟度发展不及预期;AI产业进步放缓;市场需求疲弱;下游IT开支放缓等。 目录 01 AIAgent将成为人机协同新范式 02 OpenAI率先发布Operator智能体,AI进入Agent时代 03 Operator遵守严格的数据使用规范和法律要求 04 Operator已展现较多场景的应用潜力 05 中国团队推出全球首个通用AIAgentManus,性能表现优异 06 投资建议与风险提示 全球AI快速发展推动人机协同 全球AI快速扩张,中美领先应用落地。2022年,以ChatGPT为代表的大语言模型出现,掀起了全球AI浪潮。2023年开始,大模型的多模态能力显著增强,模型可用性进一步提升,推动全球AI行业快速扩张。在基础模型层面,据斯坦福大学数据,2023年共发布149个基础模型,为2022年的两倍,模型数量快速增加。据中国信通院数据,中美两国在AI领域中处于领先地位。截至2024年,全球AI企业数量超3万家,其中美国企业超1万家,占比达34,中国占全球的15,位居第二。全球AI大模型数量为1328个(包含同一企业、同一模型的不同参数版本),美国的AI大模型数量占比44,中国大模型数量占比为36。随着大模型行业发展逐步成熟,厂商之间开始出现明显的价格竞争与市场份额抢占。同时,DeepSeek等开源模型的性能快速提升,开源与闭源模型之间差距逐步缩小,进一步刺激了各模型应用成本下降。在上述因素推动下,用户与AI协作的条件逐渐成熟,AI应用有望在2025年于中、美两国快速发展。 图:国内外大模型调用价格持续下降 资料来源:OpenAI官网,谷歌官网,通义千问官网,国信证券经济研究所整理 图:中美AI企业处于领先地位 资料来源:中国通信院《全球数字经济白皮书》2023年P29,国信证券经济研究所整理 Agent为Copilot后的人机协同新范式 AIAgent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AIAgent具备通过独立思考、调用工具去逐步完成给定目标的能力。AIAgent和传统大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果,而AIAgent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。 基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人类与AI协同的模式。随着大模型的发展,人类与模型的协同方式从最初的聊天机器人转变为Copilot,并逐步向Agent探索。Agent的落地将给AI应用带来颠覆性变化,打开AI在垂直行业渗透的入口。随着自然语言处理、机器学习和生成式AI的进步,AIAgent的多功能性和部署量将急剧增长。 图:人类与AI交互方式转变 资料来源:头豹研究院,FrostSullivan,国信证券经济研究所整理 图:AIAgent打开垂直行业应用入口 资料来源:头豹研究院,FrostSullivan,国信证券经济研究所整理 Agent是当前AI发展重点方向 AIAgent将成为新一代智能交互范式。AIAgent是能够感知环境、进行决策、执行动作的智能体,在2023已顺应大模型浪潮而生,随着多模态等技术逐步成熟,当前各厂商持续推出相关产品,Agent已开始逐步进入各个场景的工作流中。根据Gartner预测,到2028年至少15的日常工作由AIAgent自主完成,33的企业软件也将保护AIAgent。 AIAgent需要具备三大核心能力。根据OpenAI前应用研究主管的经典定义,一个合规的Agent需要三大核心能力:规划,将复杂任务分解成一些列子步骤;工具使用,选取最合适的工具并熟练应用;记忆,既有短期记忆存储即时信息,又有长期记忆沉淀持久知识。目前Agent底层技术在持续进步,因此相关代表产品也在应运而生。 图:Agent的核心能力 资料来源:36Kr,国信证券经济研究所整理 Agent市场处于爆发前夕 AIAgent持续提升,有望改变传统工作范式。传统的工作范式是基于面向过程架构,以人为中心,AI为辅助,有固定形态的交互界面、预定义有限域的任务、信息分发平台等;基于AIAgent的工作范式基于面向目标架构,以AI为中心,人为辅助,变更为动态人机交互界面、无预限制有限域任务、知识和世界模型的分发平台等。 AIAgent市场处于早期阶段,商业化产品落地前夕。目前,商业类AIAgent产品处于探索期,根据YCombinator披露数据,24年冬季入营项目中,AIAgent项目占比接近80,处于规模化应用前夕。根据RootsAnalysis预测数据,预计24年全球AIAgent市场规模为529亿美金,预计2035年达到2168亿美金,对应2435年CAGR为4015。国内AIAgent快速发展,根据华经产业研究院披露数据,23年中国AIAgent市场规模为5981亿元人民币,预计24年将超过百亿元,市场规模快速增长。 图:24年YCombinator冬季入营项目中Agent项目占比近80 资料来源:YC数据,甲子光年,国信证券经济研究所整理 图:24年全球AIAgent市场规模为529亿美金,预计35年达2168亿美金 资料来源:RootsAnalysis,国信证券经济研究所整理 目录 01 AIAgent将成为人机协同新范式 02 OpenAI率先发布Operator智能体,AI进入Agent时代 03 Operator遵守严格的数据使用规范和法律要求 04 Operator已展现较多场景的应用潜力 05 中国团队推出全球首个通用AIAgentManus,性能表现优异 06 投资建议与风险提示 OpenAI发布Operator智能体 OpenAI推出Operator智能体,模拟人类在电脑上的操作行为。2025年1月OpenAI上线了其首个AIAgentOperator,Operator能够模拟人类在电脑上的动作,如通过点击、滚动、输入等与电脑交互,并完成相关任务。Operator可以浏览网页、填写表格、订购商品、预定餐厅等,如输入餐厅预订要求后,Operator会在分析需求后直接打开一个云端浏览器并执行搜索、查找、预定等相关操作。 Operator仍处于研究预览阶段。Agent是AI产业当前进步重要方向之一,应用准确率仍待持续提升。为了确保安全和迭代进度,目前Operator处于研究预览阶段,仅面向美国的ChatGPTPro(200美元月)用户,Plus用户也不能体验,未来将进一步扩展用户。 图:Operator用户界面 资料来源:OpenAI官网,国信证券经济研究所整理 图:Operator应用场景 资料来源:OpenAI官网,国信证券经济研究所整理 Operator代表AI进入Agent时代 Operator代表OpenAI拉开L3级Agent时代序幕。OpenAI内部将AI发展阶段定义为5个阶段:聊天机器人(具备对话能力)、推理者 (具备人类问题解决能力)、Agent(具备执行任务能力)、创新者(具备创造发明能力)、组织者(具备组织工作能力)。Operator实现了AI与数字系统的交互,将自动执行桌面任务成为可能,而非调用固定API,Agent成为AI发展的新阶段。 CUA是Operator工作的主要Agent。ComputerUsingAgent(CUA)是一个计算机使用代理,其通过强化学习实现了GPT4o的视觉能力与高级推理相结合,可以像人类一样完成与图形用户界面(GUI)的交互。CUA将高级GUI感知与结构化问题解决相结合,将任务分解为多步骤计划,且会在出现问题时自动纠错。 图:OpenAI定义的5个AI发展阶段 Operator核心步骤为感知、推理、执行 Operator运行在浏览器的虚拟环境中。当前Operator主要运行在浏览器中,并构建出虚拟环境和资源进行CUA一些列动作执行。这样可以保证Operator建立多重安全控制,且避免对用户本地系统造成干扰。 感知:将任务文本和当前屏幕截图一起输入给模型,提供计算机当前状态的可视化快照。 推理:CUA使用思维链来推理后续步骤,同时考虑当前和过去的屏幕和动作。CUA同步观察和评估结果,并动态适应各环节步骤。 执行:执行点击、滚动、输入等各种动作,直到任务完成或者需要用户输入。对于敏感操作,CUA将寻求用户确认,如验证码登。 图:Operator工作原理 Operator测试已取得较大进步 Operator测试数据优于前期SOTA,但与人类差距仍较大。OSWorld是一个用于评估多模态Agent的测试集,WebArena是用于评估Agent浏览器使用性能的测试集。测评结果显示,Operator在OSWorld上实现了成功率381;We

相关内容推荐

朗诵英文学习身边好榜样建安风骨名词解释中国古书咏雪原文金钱用英语怎么说田忌赛马评课集团战略增强四个意识some怎么读家长会的收获七步洗手法教案od调查北京房屋租赁合同英语议论文范文老水牛昆虫形容瀑布的词语篮球比赛日记发明电灯的故事诗意的生活珍贵的人童心向党内容文字创业青年爱牙日手抄报健步行黄山的奇石还款计划书党员笔记苍蝇飞怎么写评语离骚者犹离忧也田园诗名句真诚地英语梅花王安石八个一柔性引进人才病媒生物防制措施雪地寻踪读后感可持续发展之路文明旅游宣传标语挤公交高速公路收费站研学心得体会壮大村级集体经济消防演练培训内容蚊子英语怎么读感情深厚的成语安全监理日志范本未来发展规划强化纪律意识包饺子的英语九九重阳节主持稿圣诞赞歌早发白帝城无私奉献精神徐志摩与陆小曼中医门诊病历静夜思古诗校内奖学金体育教学反思国庆节活动总结文旅发展垃圾桶英语怎么读一线职工学校环境施工日志范本秋天的景色手抄报培训意见好词二字家庭琐事勤劳怎么写对宣传部的认识李清照个人简介教育儿女质量手册模板保护森林英语问题整改清单记忆犹新的近义词小主持好习惯故事成本英语拜访函范文错题整理公文字体要求做手工的过程面试开场白怎么说就业推荐表特长刘禹锡的拼音军训报告说课反思民事上诉状模板摄影心得就医体验致谢词改造方案祖国妈妈诗歌朗诵倾听和聆听成本管理制度语文书怎么读英语欧洲生活温柔的词语什么改变了我作文狮子和老虎的故事祭祖文货物验收单介绍名人英语作文经营模式怎么写雨点儿诫子书拼音哄睡文本心情四字词语孔雀用英语怎么说大学生自我评估急救的英文主题教育交流研讨工作分析报告物换物挣钱用英语怎么说迫在眉睫的近义词勇敢的英文名词设备改造童心向党内容文字诚信经营承诺书理赔申请书那个早晨数学周报aoe教学反思新居入伙邀请函形势报告让的作文空山新雨后全诗三国人物介绍大全客户导向店铺简介励志故事50字大全团800商铺招商机场消防范仲淹生平预期结果怎么写参与感平行线的爱情含义做有为青年农村现状跳高比赛soap病历模板奖状内容优秀日记300字幼儿园唐诗富有的英文山西大学校训带给是词语吗整改回复报告范文群众意见模板共同努力的成语琐记好句摘抄内部认购精华英文运动会加油稿搞笑审计论文国语学习打屁屁家规动态成本兔子的说明文襄阳歌什么的姿态四个回归淡淡的清香辛苦怎么写岗位承诺书word文档分栏三年级50字日记述责述廉医药合规统计建模人事调动法制公园论文思路怎么写怎么写新闻迟到检讨藤野先生文章中小学德育学堂萝卜头的故事因为热爱志愿者申请书尝试的英文写报告的格式范文财务公开制度整洁的英语怎么说环境法的基本原则什么呼什么唤怀念哥哥感谢学校我爱读书手抄报招商运营工作内容集体备课方案襄阳歌长恨歌翻译军棋大战决定的决怎么写

站外内容推荐
慈喀SEO百科 | 卡通粉丝俱乐部 | 北极图库 | 高端网站建设 | 驱动平台 | 卡通粉丝俱乐部 | 天津万源聚 | 关键词排名优化 | seo技术团队 | 素材网站 | 网站设计制作 | 蜂巢动画 | 企业seo优化 | 驱动平台 | 网站seo优化 | 耗材资讯 | seo营销推广 | 惠祥源知识网 | 河南CSCI核心 | 企业网站seo | 耗材资讯