2025年,被称为“智能体元年”。这是AI发展路径上的一次范式突变:从“我说AI答”到“我说Al做”,从对话生成跃迁到自动执行,智能体正成为最重要的商业化锚点和下一代人机交互范式。
但越接近落地,风险也越有实感。智能体的核心能力——自主性、行动力,也恰恰是风险滋生的窗口。越能干的智能体,越可能越权、越界,甚至失控。
结合调查问卷和行业访谈,本次《智能体体检报告》从最新发展状况、合规认知度、合规实际案例三个角度,试图回答清楚一个关键问题:智能体狂奔之时,安全合规是否就绪了?
观点速览<<
1.概念正热。垂直智能体领跑,编程场景已诞生ARR破5亿美元产品。
2.地图扩张中。从AI手机到AI浏览器,智能体正在接管日常入口。
3.谁更“能自理”谁能走得远。容错性与自主性,可以为智能体划分价值象限。
4.“安全重要,但不着急”。业内普遍认同智能体安全合规很重要,但优先级排不进TOP 3。
5.出错与泄露。业内最关心的智能体风险仍是AI幻觉和用户数据泄露。
6.下一代应用商店?智能体广场的安全监测、安全标识还不完善。
7.智能体进化之路。智能体协作是落地关键,安全风险问题待解。
8.多工具调用暗角丛生。用户数据流向和责任分配问题待解。
作为市场最火热的概念,今年资本市场及公司动态几乎都与智能体挂钩。但不少讨论中的智能体定义混乱,以至于一千个人眼中有一千个智能体。为了准确把握市场动态,必须清晰界定真正的AI智能体,并与前代技术区分开来。
OpenAI将AI发展阶段分为L1到L5五个阶段。L3阶段即为智能体(Agent),能够自主规划和执行复杂任务,同时具备了对话能力、推理能力、长记忆、工具调用这四项能力¹。
其中,工具调用是最核心的区分要素,只有对话能力的是L1阶段的聊天机器人(Chatbot),只有对话和推理能力的是L2阶段的推理者(Reasoner)。这种定义有助于我们识别并警惕一些夸大产品能力,将自动化软件或对话式助手包装成智能体。
智能体强大能力的自主性、规划能力以及与外部世界交互的能力,也带来了一个核心的矛盾:效用与风险共生。不过,在深入探讨安全风险之前,我们需要先了解智能体最新的技术和产业情况。
(一)通用vs垂直:编程产品领跑
我们将智能体划分为通用型智能体和垂直型智能体,这两者在技术栈、优化目标和应用范围上存在显著差异。
通用智能体能够跨多个领域,提供基本认知能力,泛化能力强,能实现多模态交互和生态协同。比如助推了智能体概念的Manus,其定位是“首个通用智能体”,核心能力在于任务拆解与工具调用,通过提示完成复杂的分析项目。
垂直智能体专注于特定领域,深度融合专业知识和行业数据,通过定制优化使行业数据更精准,训练效果更稳定。2024年以来,垂直智能体在办公软件(WPS、钉钉、飞书)、金融(支付宝、微信风控)、法律(通义法睿、金山晓法)等领域开始落地。
总的来说,通用智能体在挑战“上限”和“广度”,而垂直智能体则夯实“下限”和“深度”。通用和垂直方向各有价值。
目前来看,垂直型智能体凭借其深度领域知识和定制化能力,或许更容易找到精准用户并形成可持续的商业模式。比如,从数据隐私与合规性角度看,在金融、法律等高度敏感和受监管的行业,市场更倾向于选择了解并能满足特定数据安全和合规要求的垂直解决方案提供商。
红杉在AI峰会上提到,“企业级市场中,真正先跑出来的入口是垂直领域智能体,因为它们能听懂行业语言,理解真实需求。²”而智能体最先落地的行业和场景可能是知识工作,尤其是代码编程。根据Anthropic在2025年3月发布的论文,Claude Al的使用主要集中在软件开发和写作任务,这两者合计占了近一半的总使用量³。Cursor仅用了大约12个月的时间,成为最短时间内突破1亿美元年经常性收入(ARR)的软件产品,截至2025年6月已突破5亿美元。
(二)产业链:复杂的“竞合”关系
智能体市场从技术架构角度可以划分为基础层、平台层和应用层,由此搭建起智能体产业链的上中下游。
科技大厂巨头、创业团队、终端厂商等市场上的玩家们,在产业链各环节互相交叉渗透。
科技巨头的打法普遍以大模型为底座,一边持续迭代,一边布局智能体平台和生态,吸引开发者到平台上搭建各类智能体应用,并将智能体集成到现有的产品和业务中。凭借在资金、数据、算力、庞大的生态系统和云基础设施,构建全面的“智能体工厂”。毕竟谁拥有了最强大的开发平台和最活跃的开发者生态,谁就掌握了AI时代的“入口”与“分发权”。
头部创业团队在核心智能体能力(如推理、执行动作)方面做颠覆性创新,形成与科技巨头之间“竞合”的动态关系——它们既接受巨头的投资,又与其展开竞争。比如智谱其股东阵容多元,美团、腾讯、阿里、蚂蚁都位列持股名单,Manus在今年3月份宣布与阿里通义千问团队达成战略合作。
终端厂商依靠设备入口、强大的供应链、生态链,在速度和个性化上进行差异化竞争。比如小米通过搭载自研或第三方AI芯片,在其众多设备端执行大部分AI任务,当遇到复杂任务时,通过金山云等云端服务调用更强算力。
上游:底座大模型与基础设施
基础模型是智能体的“大脑”,科技巨头们都推出了自己的大模型,如百度文心、阿里通义千问、腾讯混元、字节豆包等。目前,大模型厂商都在加快推进多模态大模型进展,以快速提升通用基础大模型的理解、推理、规划和学习能力,多模态大模型的技术进步让智能体的能力也随之提升。有机构研报测算,强大的多模态基础模型(能理解视觉信息如屏幕内容)和成熟的强化学习训练方法(能训练Agent与环境交互),目前已经发展到相对成熟的阶段4。
基础设施为模型训练和推理提供必要的计算资源,比如阿里云、华为云、金山云等云计算平台;寒武纪等芯片企业;以及数据采集与标注企业等。随着智能体向端侧发展,对独立、低延时、安全等要求增强,华为、小米等终端厂商都在边缘计算领域大量投入。
本文来自知之小站
PDF完整报告已分享至知识星球,微信扫码加入立享4万+最新精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)
