政企行业AI Agent智能体研究报告:中国电信、信通院、百度、火山引擎、360、软通等共同发布,提出政企行业AI Agent总体框架,总结SaaS账号式服务、API嵌入式服务和定制化服务三大实施路径(附下载)

智能体在大模型类项目名称中出现的频率越来越高,成为市场主流建设内容之一。如果说大模型是“智慧大脑”,那么智能体(AI Agent)就像是大模型的“实际执行者”,它可以像人一样感知周围环境,听懂语音、看懂图片等各种信息,还能通过学习进行思考,并调用各类工具解决问题,帮助大模型真正应用到实际场景中。
2025年4月29日,由中国电信政企信息服务事业群联合中国信通院、百度、火山引擎等生态联盟伙伴共同编制的《政企行业智能体研究报告(白皮书)》正式发布,首次系统性定义行业智能体的技术标准与生态架构,全面总结出政企智能化转型的指南。

640-2

《政企行业Agent研究报告(白皮书)》发布现场

如今,智能化正成为推动经济社会发展的重要动力。政企行业智能化转型也成为了顺应新时代发展潮流的必然选择。随着大模型技术的持续优化以及市场对智能化需求的持续增加,大模型在实际应用中越来越普遍。如果说大模型是“智慧大脑”,那么智能体(AI Agent)就像是大模型的“实际执行者”,它可以像人一样感知周围环境,听懂语音、看懂图片并处理各种信息,还能通过学习进行思考,并调用各类工具解决问题,帮助大模型真正应用到实际场景中。在此背景下,中国电信政企信息服务事业群联合中国信通院、百度、火山引擎等生态联盟伙伴,首次系统性定义行业智能体的技术标准与生态架构,全面总结出政企智能化转型的指南。《白皮书》是政企行业智能化升级进程中的文献参考。全文共5章、18节,涉及政企行业智能化转型的多个关键方面;创新性提出了政企行业AI Agent总体框架和技术架构;列举场景化应用案例,展现应用价值;构建AI Agent技术与应用评价体系;提出推动AI Agent建设标准化、安全化,加强多AI Agent协同能力等可行解决方案,助力行业健康发展。

640

《政企行业智能体研究报告》

  • 参与单位

中国电信集团有限公司政企信息服务事业群、中国信息通信研究院云计算与大数据研究所、北京百度网讯科技有限公司、北京火山引擎科技有限公司、北京奇虎科技有限公司、软通动力信息技术(集团)股份有限公司、北京数巅科技有限公司、北京东方国信科技股份有限公司

  • 主要撰稿人

白彦朋 毕京云 曹智 储伟伟 董恒禹 甘志辉 顾延鸽 郭瑞峰 何昌华 何杰 胡东 胡杰 江民民 李慧欣 李康 李亚军李轶承 栗蔚 刘敬谦 刘世伟 刘婷 刘威辰 刘沅 罗建平 牛宝童 钱蓓蓓 任伟 舒坦 宋光通 宋佳明 宋雪思 宋宇 苏振 孙海 孙佳 孙文斌 田耘 汪滔 王策 王栋 王宁 王卫民 魏子凌 吴佳兴 吴隽 吴宁 邢志刚 徐恩庆 杨安 杨琛杨戈 杨华锋 杨锦才 杨凯 杨毅 杨占行 张宝玉 张琳琳 张晓光 赵文瑞 赵鑫 周颖

注:以上名单按姓氏顺序排列,排名不分先后。

前  言

在新时代的征途上,我国正全面推进深化改革,力图在全球化浪潮中把握新的发展机遇。智能化作为推动经济社会发展的重要引擎,已被提升至国家战略层面。政企行业作为国家治理和市场经济的关键领域,其智能化转型不仅是提升治理能力和产业竞争力的迫切需要,也是适应新时代发展要求的必然选择。随着《关于进一步优化政务服务提升行政效能推动“高效办成一件事”的指导意见》、《关于推动未来产业创新发展的实施意见》、《生成式人工智能服务管理暂行办法》等一系列政策文件的密集出台,我国对政企行业的智能化发展提出了明确要求,旨在通过政策引导和技术赋能,加速传统产业的数字化转型,促进政务服务的智慧化升级与企业的智能化转型并行不悖,共同绘制出一幅产业蝶变焕新的宏伟蓝图。

在此背景下,中国电信集团有限公司政企信息服务事业群联合中国信息通信研究院云计算与大数据研究所以及生态联盟伙伴,依托双方在政企行业领域大模型和AI Agent的研究成果与实践经验,围绕梳理政企政策发展目标、分析政企行业AI Agent现状及技术能力、精选政企行业AI Agent场景化应用典型案例、构建政企行业AI Agent技术评价体系以及展望政企行业AI Agent未来趋势形成本报告,旨在为政企行业的智能化升级提供战略指引和实践参考,推动我国政企行业在智能化道路上稳步前行。

 

目录

 

一、智效双兴引领政企发展新范式

(一)效能为先成政企发展的落脚点

(二)架构优化推动大模型能力突破

(三)落地实践仍存在若干痛点堵点

(四)智能体蓬勃应用带动数智升级

二、政企行业AI Agent提供尽微致广新思路

(一)AI Agent成为大模型落地应用的必然选择

(二)政企行业AI Agent总体框架

(三)政企行业AI Agent技术架构

(四)政企行业AI Agent实施路径

三、政企行业AI Agent场景化应用典型案例

(一)政企行业AI Agent赋智数字治理

(二)政企行业AI Agent赋力数字民生

(三)政企行业AI Agent赋能数字产业

四、政企行业AI Agent技术与应用评价体系

(一)政企行业AI Agent关键技术评价指标

(二)政企行业AI Agent平台评价指标

五、政企行业AI Agent大规模应用痛点和解决思路

(一)应对不稳定、不可靠问题,AI Agent建设更趋标准化、安全化

(二)应对复杂问题处理效率性,多AI Agent协同能力将持续加强

(三)应对多元发展需求,多模态AI Agent、具身智能将成为解决思路

(四)应对建设成本问题,AI Agent平台即服务有望成为主流服务模式

(五)为推动行业生态健康发展,AI Agent应用相关标准体系将持续丰富

正文:

2023年2月,党中央、国务院印发了《数字中国建设整体布局规划》,强调要坚持稳中求进工作总基调,完整、准确、全面贯彻新发展理念,加快构建新发展格局,着力推动高质量发展,要促进数字经济和实体经济深度融合,以数字化驱动生产生活和治理方式变革。

面向当前和今后这个以中国式现代化全面推进强国建设、民族复兴伟业的关键时期,改革的重要性不断突出,实效的关注度不断加强,数智技术的抓手性不断得到强调。

一、智效双兴引领政企发展新范式

(一)效能为先成政企发展的落脚点

人工智能作为引领未来的战略性技术,是新一轮科技革命和产业变革的核心驱动力,是打造新质生产力的关键引擎。

2024年5月,国家数据局等四部委联合印发《关于深化智慧城市发展推进城市全域数字化转型的指导意见》,鼓励发展基于人工智能等技术的智能分析、智能调度、智能监管、辅助决策,全面支撑赋能城市数字化转型场景建设与发展。《关于加快公共数据资源开发利用的意见》指出,支持人工智能政务服务大模型开发、训练和应用,提高公共服务和社会治理智能化水平。

2024年2月,国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会,会议认为,加快推动人工智能发展,是国资央企发挥功能使命,抢抓战略机遇,培育新质生产力,推进高质量发展的必然要求。会议强调,中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展人工智能产业。

24和25年政府工作报告连续强调要推进“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广泛应用,大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备。

党中央、国务院高度重视数字政府和政务服务工作,全面提升政务服务效能是便利企业和群众办事创业、畅通国民经济循环、加快构建新发展格局的必然要求,也是优化营商环境、推进国家治理体系和治理能力现代化的重要举措,对于建设人民满意的法治政府、创新政府、廉洁政府和服务型政府有重要意义。

2022年6月,国务院印发《关于加强数字政府建设的指导意见》,提出要充分发挥数字技术创新变革优势,优化业务流程,创新协同方式,推动政府履职效能持续优化。

2024年1月,国务院印发《关于进一步优化政务服务提升行政效能推动“高效办成一件事”的指导意见》,强调优化政务服务、提升行政效能是优化营商环境、建设全国统一大市场的必然要求,对加快构建新发展格局、推动高质量发展具有重要意义。

提升企业活力效率是企业改革深化提升的关键之举。

“十四五”规划明确提出,要“打好关键核心技术攻坚战,提高创新链整体效能”。2020年,国务院国资委发布《关于加快推进国有企业数字化转型工作的通知》,提出要推进5G、大数据、人工智能等技术规模化集成应用,赋能企业提质增效。2021年10月,市场监管总局等六部委联合印发《关于进一步发挥质量基础设施支撑引领民营企业提质增效升级作用的意见》,提出要提供高效便捷的质量技术服务,促进民营企业提质增效升级。

在数字经济时代,数字化转型是经济主体实现高质量发展的必由之路。习近平总书记强调:“我国经济由高速增长转向高质量发展,这是必须迈过的坎,每个产业、每个企业都要朝着这个方向坚定往前走。”当面临高速变化的经济环境时,企业效率的提升成为企业高质量发展的重要体现。据中国信通院《央国企数智化转型发展报告(2024)》显示,提升运营效率、增强创新能力、应对市场竞争和响应客户需求成为驱动企业数智化转型的最主要力量。

b9291ef2b185cb9af292a289413ab5b1来源:中国信通院《央国企数智化转型发展报告2024》

图1 企业数字化转型驱动因素图

(二)架构优化推动大模型能力突破

 

架构优化驱动基础模型能效提升。随着Deepseek和QwQ-32B等大模型技术架构的持续升级,模型的算力效率与泛化能力实现了突破性提升。以Deepseek-V3 671B为例,一个强大的专家混合(MoE)语言模型,总共有6710亿个参数,每次处理token时激活370亿个参数。通过采用多头潜在注意力(MLA)和DeepSeekMoE架构,显著提升推理效率并降低训练成本。此外,DeepSeek-V3创新性地引入无辅助损失的负载均衡策略,并采用多标记预测训练目标以获得更强的模型性能。尽管性能出色,但DeepSeek-V3只需要2.788百万H800GPU小时即可进行完整训练。

开源策略进一步放大了架构升级的边际效益。一方面,开放的模型参数与训练代码加速了社区协作,推动了技术迭代速度;另一方面,开源生态降低了企业与研究机构的试错成本,使资源从重复性开发转向创新性应用。例如,开源模型的轻量化版本可直接部署于边缘设备,而企业则能基于开源框架快速定制垂直领域模型,形成“基础模型-行业适配-场景落地”的高效闭环。这种“技术普惠”模式,不仅降低了AI应用的准入门槛,更通过社区反馈的持续优化,推动基础模型向更高效、更鲁棒的方向演进。

模型蒸馏、强化学习微调等优化技术逐步推动基础大模型的能力飞跃。强化学习路径方面,DeepSeek-R1-Zero首次证明,仅通过纯强化学习即可激发大模型的推理能力,无需传统监督微调。其通过自我对弈式训练,使模型自主生成长思维链,实现复杂问题求解与自我验证,标志着我国团队在大模型技术上的原始创新。模型蒸馏技术则通过知识迁移,将大模型(如DeepSeek-R1)的推理模式高效压缩至小模型(如Qwen、Llama),例如蒸馏后的32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。其核心在于让学生模型模仿教师模型的深层思考逻辑,而非简单复制答案,从而兼顾推理能力与资源效率。两项技术的协同创新,大幅降低了模型部署门槛,推动大模型在推理效率、任务适应性及资源利用率上实现突破,为构建高效智能系统奠定基础。

(三)落地实践仍存在若干痛点堵点

尽管政策与行业实践已为政企智效提升点明了前进方向,但在实际实施层面,仍存在若干痛点堵点,具体体现在路径、成本、实现和转化等方面。

一是路径选择方面,主管单位顾虑场景应用的典型性和合理性,企业担心新技术应用的表现不及预期,在找场景、抓切口方面存在诸多疑虑,面对场景价值的分类和遴选,缺乏成熟方法支撑。

二是成本问题,大模型部署推理存在低延时、高吞吐、高可扩展性和安全性的需求,需通过推理框架实现在不同的硬件平台统一高效部署和运行大模型,并实现有效内存管理和性能优化。常规而言8张V100显卡最多支持部署1个70B左右基模和4个6B至8B基模,或支持部署4个4bit量化的70B左右基模,基础硬件和训推过程产生的高额成本也是推动快节奏使用的一大堵点。

三是实效问题,以大模型为代表的智能化技术客观存在指标语义理解难、大模型幻觉和专业度不足等问题,如何定义智能化技术的预期实效产出仍待持续权酌。

四是转化问题,投入大量成本、引入了专业力量的智能化技术如何转化为典型化、自适应化的解决方案赋能政企行业高质量发展有待深入实践。

(四)智能体蓬勃应用带动数智升级

大模型“智能涌现”驱动人工智能市场快速增长。

在产业规模上,根据中国信息通信研究院数据显示,人工智能产业规模持续扩大。2022年产业规模达到5080亿元,截至2023年底,我国人工智能核心产业规模接近5800亿元,已经形成了京津、长三角、珠三角三大集聚发展区,核心企业数量超过4400家,居全球第二。在解决方案市场方面,根据IDC报告显示,中国MaaS市场和AI大模型解决方案市场在2024年上半年已分别达到2.5亿元人民币和13.8亿元人民币,均预计将在2024-2028年期间保持高速增长,分别达到年均复合增长率64.8%和56.2%

大模型对于其卓越的处理能力和优秀的问题推理能力,有效满足了政府和企业以及其他行业对数字化转型与智能化升级的迫切需求,显著推动了应用的智能化进程。随着大模型技术的持续优化以及市场需求的稳步增长,其在实际应用中的实施变得日益广泛。在这一过程中,智能体(以下称为“AI Agent”),作为一种模拟人类智能行为的计算机程序,其能力包括理解自然语言、进行对话、学习、推理、感知环境以及解决问题,正成为实现大模型技术落地的关键途径。这一发展态势不仅促进了服务向商业化和市场化方向的快速迈进,而且为人工智能市场的迅猛扩张提供了坚实的推动力。

全栈式工程化智能体范式加速AI Agent产品化落地。以Manus为代表的AI Agent,通过多代理协同架构、模型调度优化、动态任务调度引擎及安全验证机制,构建了从任务解析到结果交付的全链路闭环,展现了工程化创新对产业应用的推动价值。其技术路径聚焦工具链整合而非底层模型研发,既通过蒙特卡洛树搜索算法与联邦学习等技术实现任务拆解效率与数据隐私保护,又通过云端异步运行任务时,用户可关闭设备,后台仍能高效执行并通知结果。此外,Manus的工程化实践与开源生态的协同演进,正重构AI技术壁垒重心转向工具链整合,加速AI Agent适配垂直领域需求,推动医疗、教育、零售、金童等多种应用场景全流程自动化升级。

AI Agent应用在各行业热度持续上涨。AI Agent应用政企各行业就绪度水平通过典型政企行业五年间基础设施、算法模型、业务场景、人才团队、战略规划、经费预算等方面的能力现状,分析各行业基础资源的完备度、人才团队配比的平衡度、战略规划与AI Agent应用的契合度,综合研判应用能力的就绪度水平,并通过各行业间的横向

对比,反映各行业AI Agent应用的现状与预期。从具体行业AI Agent应用热力值来看,政务行业场景占据领头地位,逐年跨级增长。教育、能源暂处“第二梯队”,在相关行业政策推动下,AI Agent应用广度和深度将持续“攀升”。文宣、住建、交通行业场景发展较为缓慢,随着行业智能应用相关概念的兴起,未来预期将会保持相对广阔的发展势头。到2026年,随着AI Agent在政务、教育、能源行业的深度应用,预期将会带动全行业“数智升级”。

a96c8761fdd9911a4b737c5990c8030d来源:中国信息通信研究院,2025年4月

图2 政企行业AI Agent应用就绪度热力图

从2024年AI Agent应用各政企行业占比情况看,行业引领驱动效应显著,整体呈现“点面相映,蓬勃生动”的局面。

从行业应用引领度上看,政务、教育、能源三大领域依托基础资源先发优势及场景需求切实刺激,孵化典型实践场景,总结结构化实践路径,形成行业应用重要推动力。

从全行业应用推广度上看,行业AI Agent已经在各个领域得到了初步的应用和发展,未来将有望成为AI行业应用层的基本架构,包括ToC、ToB产品等。行业AI Agent的研究与应用实践是不断探索接近AGI的过程,随着AI Agent变得愈发“可用”和“好用”,“行业+AI Agent”的产品将会越来越多,并引领未来产品的主流发展方向。

46e6e552318d5847216a277fd95d6748

来源:中国信息通信研究院,2025年4月

图3 2024年政企行业AI Agent应用占比图

二、政企行业AI Agent提供尽微致广新思路

随着智能化技术对政府运行、企业经营的引领效应不断凸显,通过以大模型为大脑,以规划、工具、记忆三大基本能力模块为指导,构建环境自适应、自驱进化的行业智能化平台,将成为政企行业用户快速、低成本“颠覆”过往工作范式的必由之路。

未来,政企行业智能化平台的建设运营不仅需要持续更新的技术支持,也需要以前瞻性的眼光切入政府治理和企业运行关键场景,更需要在投入与产出之间不断权衡,榷算最优解。为此,在本报告中提出政企行业AI Agent的建设思路,全面“赋智”政企行业高质量发展。

(一)AI Agent成为大模型落地应用的必然选择

相比于大模型依赖预训练知识且学习新知识成本高,AI Agent能够以更低的成本高效吸收新信息,确保系统与业务持续同步。大模型主要依靠预训练阶段积累的知识来执行任务,当面临新的信息或未知情景时,为了有效适应这些变化,通常需要进行额外的训练或微调,这不仅涉及到大量的计算资源消耗,还需要较长的时间周期,导致新知识的学习成本显著增加。

相比之下,AI Agent通过集成向量存储、检索增强生成、大模型、任务规划、工具接入、反思机制、记忆功能等技术能力,不仅能从海量行业知识信息中提炼出有价值的知识,构建起专家级、可查询复用的专题知识库,还能够从这些知识资产通过复杂问题快速提供给需要的用户或系统,极大地提高了信息的可获取性和应用效率。

最重要的是,当数据有更新时,可以迅速补充新的数据集进行知识更新,无需像大型模型那样进行耗时的重新训练,这种高效的数据管理能力,使得AI Agent能够持续保持与业务需求的同步。

65759b55f1c76ce173db70552f8653d7来源:公开材料整理

图4 从RAG向AI Agent演进示意图

AI Agent比大模型具有更高的迭代效率和更强的系统工具集成能力,能够通过接口调用等方式快速集成和调用外部工具,从而在行业应用中表现出更高的灵活性和响应速度。

在迭代效率方面,AI Agent通常设计为轻量级且模块化,这使得开发人员可以更容易地对单个组件进行更新。这样的特性不仅减少了计算资源的需求,也缩短了开发周期,从而加速了产品或服务推向市场的步伐。

此外,在工具集成能力方面,AI Agent的架构设计支持模块化扩展,允许开发者根据实际需求快速新增功能模块或集成外部工具。这种“插件式”的扩展方式使其能够灵活应对多样化的应用场景。与之相比,大型模型往往受限于其庞大的参数规模和复杂的训练流程,新增功能或调整行为通常需要全面的重新训练,这不仅耗时耗力,而且成本高昂。

大模型在处理复杂场景时仅限于提供信息和建议,而不具备执行能力;而在AI Agent能够自主完成从任务拆分到执行的全过程,人类则主要负责设定目标、提供资源、监控进展和最终决策。

例如,在软件工程层面,人工智能技术已全面覆盖软件开发和维护的整个流程,不仅能够针对特定环节提供高效的解决方案,还能在处理复杂的端到端任务时展现出巨大的潜力。

AI Agent可以通过大模型意图识别和生成能力在需求获取阶段准确理解并捕捉用户需求,并自动生成详细的需求规格说明书;

在设计与编码阶段,AI Agent能够根据既定的设计模式和编码规范自动生成高质量代码,甚至对现有代码进行重构以提高其可读性和可维护性;

在测试阶段,AI Agent可以自动生成测试用例并执行自动化测试,快速发现潜在缺陷;

而在维护阶段,AI Agent则能够协助进行故障定位、代码修复等工作,显著缩短问题解决周期。

此外,借助多AI Agent协同能力,还可以实现跨部门、跨项目的复杂软件工程任务的有效管理与调度,从而进一步推动软件开发流程的智能化与自动化水平,加速软件产品的迭代速度,提升整体质量和用户体验。

这样的转变不仅仅是技术层面的进步,更是软件工程领域的一次深刻变革,预示着未来软件开发将朝着更加高效、智能的方向发展。

d2bd213ad31ff083707021288ee216b3

图5 AI原生应用开发平台功能图

AI Agent能力进化开启人机交互全新方式。UI Agent能够代替用户在手机和网页上完成各种操作,如点外卖、发微信、写点评、写摘要、电商下单等。而端侧智能体能力进化将开启人机交互全新方式,能力有望延伸至智能眼镜、智能耳机、智能家居等。同时,AI Agent展现使用计算机能力,同时编码能力大幅提升。UI Agent目前已初步达到三级AI能力水平,这意味着它不仅能够利用各种工具,而且系统能够执行实际动作,解决大多数人类在物理世界面临的问题。

AI Agent的应用扩展了大模型能力,进而提升大语言模型的实际应用价值。例如,在长文本生成领域,现有大部分落地的大模型能处理的文档长度通常有限,然而在教育、出版等实际场景中往往需要长文本生成。通过引入AI Agent,可以将复杂的长文本任务分解成一系列更易于管理的子任务。每个子任务可以独立处理,然后通过特定的策略将这些子任务的结果进行有效整合,形成连贯且完整的输出。

这种方法不仅克服了长文本处理的技术瓶颈,还提高了处理的灵活性和效率,使得大模型能够更好地应对实际应用中的复杂需求。

(二)政企行业AI Agent总体框架

以服务数字政府高质量发展和助力企业创新性转型为战略目标,结合各地方各行业项目实践,我们提出政企行业AI Agent总体框架。

84f703133d10159238189db3a9ec4319图6 政企行业AI Agent总体框架图

在底座层,通过对AI云基础能力、大模型组件、数据仓库和第三方API进行有机整合,构建起政企行业AI Agent能力底座,为上层价值释放提供能力支撑。

在构建层,融合知识检索、数据分析和代码解析能力,通过规划加编排的方式,以AI Agent商店、低/无代码、生态协同开发和智能助手等形式提供政企行业AI Agent构建分发服务。同时,构建层的一应服务在标准规范体系和安全可信体系的总体指导下,为政企行业用户提供安全化、标准化的智能服务。

在应用层,根据行业场景应用需要,政企行业AI Agent支撑工业、住建、能源、政务等十余个行业应用的构建与分发。

在价值层,通过政企行业AI Agent的应用,可以带来直接的成本节约成效;伴随着应用深度的逐步加大,能效提升的间接价值也将随之放大;随着多行业共同深度依托政企行业AI Agent推动行业数智化转型,行业创新的宏观价值将会愈加外放,并最终推动行业服务范式的有力更迭。

(三)政企行业AI Agent技术架构

从技术架构来看,模型层是政企行业AI Agent技术架构的基石。大模型作为AI Agent的“大脑”,负责理解用户的输入数据,并生成最终的响应反馈给用户。

模型层则通过统一纳管多样化的前沿大模型资源,集成了覆盖广泛、功能强大的大模型仓库。

能力层构建于模型层之上,作为AI Agent的核心技术能力,能够处理任务拆解和制定决策,存储并管理AI Agent在与环境交互过程中的信息,并调用工具实施计划。

平台层作为AI Agent架构的中坚力量,提供一套全面且高效的政企行业AI Agent应用搭建体系,确保AI Agent从设计到部署的全生命周期管理能够无缝衔接、高效运行。

应用服务层位于架构的最顶层,直接面向政企行业的具体应用场景。

eeffa451274ab57f8a933cd6ae4a88ff图7 政企行业AI Agent技术架构图

在模型层,政企行业AI Agent技术架构强调集成多样化的模型选择,这包括但不限于开源与闭源模型,以及基础模型与行业大模型,旨在构建一个全面的模型仓库,以增强AI Agent对复杂世界知识的理解和处理能力。具体而言,它涵盖了语言大模型、视觉大模型、语音大模型和多模态大模型等基础大模型、向量表示模型、重排序模型、查询改写模型、意图识别模型、相似问题生成模型以及问答对生成模型等,以适应不同的业务需求和数据特性。多样化模型的提供为智能体提供强大的思考能力、推理能力、安全能力和检索能力。这些模型能够处理复杂的业务问题,提高决策的精准度。

在能力层,政企行业AI Agent技术架构集成了规划、记忆存储与检索以及执行三大核心功能,为AI Agent在复杂任务处理、信息高效获取及自适应性能优化方面提供了技术支撑。规划功能涵盖了任务分解、决策规划和调度规划,确保AI Agent能够将复杂任务拆解为可操作的子任务,通过算法如决策树、强化学习等来选择最优行动方案,并通过调度算法如遗传算法、线性规划等来优化资源和时间的分配。记忆存储与检索功能则包括短期记忆和长期记忆,前者用于临时存储当前任务相关的即时信息,后者则保存历史数据和经验,结合高效的存储和检索机制,使得AI Agent能够快速准确地获取所需信息。执行功能不仅涉及根据规划结果精确执行动作,还包括调用通用工具和特定行业应用来扩展AI Agent的能力范围,同时通过反馈学习机制,AI Agent能够根据任务执行的结果不断调整和优化自身的性能,从而更有效地适应不断变化的需求和环境。

在平台层,通过精准创建、高效评估、多渠道发布与可视化监控,确保AI Agent稳定运行与用户体验,并提升开发效率与应用灵活性。

AI Agent创建阶段,首先系统支持角色设定,定义AI Agent在特定业务场景中的角色和职责,确保其行为符合预期目标;其次支持进行工作流模式设定,配置AI Agent处理任务的具体流程,包括问题分类器、任务触发条件、执行顺序、模型输出、终止结束等,以实现自动化和标准化的操作。此外,通过工具配置集成各类辅助工具以增强AI Agent的功能,包括天气查询、车票查询、地图等通用开源工具,以及特定行业的专业工具,例如建筑行业的绘图工具、交通行业的智能施工验收工具、法律行业的信息收集工具等,政策法规的信息检索工具等。

其中,检索增强生成(Retrieval-AugmentedGeneration,RAG)技术作为工具配置的核心,通过灵活运用“知识图谱+RAG”、模块化RAG等多种算法的协同策略,有效应对各类复杂查询需求,显著提高了问题解答的精确度。在处理用户提出的总结类问题时,“知识图谱+RAG”通过整合知识图谱中的结构化数据和非结构化数据,增强了RAG系统处理多跳推理及综合不同信息片段的能力,以全面应对复杂任务。针对需要查表类问题,自然语言转SQL语句(NL2SQL)技术的应用将用户的自然语言Query转换成SQL语句,通过数据库查询得到中间结果,然后利用大模型来生成最终结果。这种技术能够减少基于嵌入的语义搜索所导致的不准确性。对于其他类别的问题,模块化RAG模块提供了一种系统化的处理流程。在这个模块中,问题首先通过向量化(Embedding)技术进行处理,根据实际需求,一次或者多次按照不同的顺序调用检索、重排序、生成等模块,最终将结果并反馈给用户。模块化RAG模块的这种依次处理方式,确保了在面对不同类型的问题时,RAG系统能够以最高效和准确的方式提供答案。

1ac72943e5053ee794444dd64380d228图8 RAG系统处理流程

在此基础上,通过引入具备动态决策和工作流优化能力的自主智能体,形成Agentic RAG,运用迭代优化和自适应检索策略,有效解决复杂、实时和跨领域的查询需求。Agentic RAG通过将问答过程分解为可管理的步骤、为每个任务分配合适的代理以及确保无缝协调以获得最佳结果来协调问答过程。框架内的代理能够进行复杂的规划和多步骤推理,并以此确定信息检索、分析和综合的最佳策略,以有效地回答复杂的问题。在灵活性与定制性方面,相较于传统方法,Agentic RAG可以充分针对政企行业任务和信息环境特点进行定制,进而大幅提升准确性和问答效率。

04d11d741b10f092982b9e23470e8526

图9 Agentic RAG处理流程

此外,在平台层,构建并维护一个集成领域专业知识、历史数据和最佳实践的知识库至关重要,以此为AI Agent的决策过程提供坚实的支持。在知识库构建的过程中,关键步骤包括文档解析、内容提取与清洗、文档切片以及索引构建,这些环节共同确保了知识库的准确性、可用性和高效性。在实施知识库创建的过程中,首先开展文档解析工作,此步骤涉及对多种文档格式,包括Doc和Excel等多种类型的识别,针对不同的文档采用定制化的解析方式。该阶段的核心任务是提取文档内容和解析文档的层级结构,确保包括各层标题在内的信息得到准确识别,并对文档内容进行清洗,以滤除无关信息,维护知识库的准确性与高可用性。其次是对文档切片环节,系统将依据文章的结构特点进行精确切片,包括按照文章层次结构切片、等距离切片和基于语义的切片等多种方式,从而确保知识点的独立性与连贯性。最终,进行索引构建,该阶段包括建立父子切片间的索引关系,创建摘要索引以提升信息检索效率,构建用户查询(Query)索引以增强搜索的精确度,以及添加元数据以丰富知识库的信息维度,从而完成知识库的高效构建,让AI Agent成为真正的行业知识专家。在AI Agent工具配置方面,MCP(Model Context Protocol,模型上下文协议)通过建立AI Agent与工具的标准化交互范式,将原本复杂的”AI Agent-工具”网状适配关系解耦为线性扩展模式,其核心优势在于通过协议层实现工具能力的统一抽象与动态编排。在实现方式上,MCP构建了双层解耦架构:当用户发起请求时,大模型基于实时上下文分析自动选择匹配工具(如数据库查询、云服务配置接口等),通过MCP协议服务器执行标准化指令并返回结构化数据,最终由大模型整合生成自然语言响应。该机制将AI Agent开发从工具适配中解放,使开发者仅需关注业务逻辑构建,通过声明式接口描述即可完成跨平台工具集成,既避免了重复开发适配层导致的资源浪费,又支持工具库的动态扩展与按需组合,形成”AI Agent快速迭代+工具生态持续进化”的双向增强闭环,从根本上降低系统集成复杂度与运维成本。

8fed8d245b644b06221afbffc9f93292

图10 MCP架构示意图

在AI Agent评估与优化阶段,系统通过任务准确性评估、工程性能评估以及安全评估,全方位检测AI Agent的表现。例如,优化AI Agent构建流程对于提升开发效率起到了显著作用。不同的框架各具核心优势,有的通过将人类工作流程融入元编程策略来强化标准操作程序(SOP),有的则支持根据特定任务需求动态调整AI Agent团队配置,从而优化任务执行效率和成果。在实际应用场景中,应根据具体业务需求选择最合适的AI Agent框架。

在AI Agent发布阶段,AI Agent可以通过网页或API调用的方式对外提供服务,并支持多渠道发布,便于不同平台和应用场景的接入。在应用监控阶段,系统通过对用户数据分析、可视化关键信息展示以及用户权限管理,实现了对AI Agent运行状态的有效跟踪与控制,确保整个系统的稳定性和用户体验。此外,为提高平台的开发效率,在平台功能设计上,可借助可视化工具,使开发者能够快速自定义提示词(prompt)、工具、知识库等组件,并结合基于画布的工作流(workflow)、RAG、模型管理、prompt优化等功能模块,根据具体需求构建定制化的AI应用。

在应用服务层中,政企行业AI Agent应用广泛覆盖了工业、交通、政务、政法、消防、文宣、农业、教育、车企等多个领域。平台提供了行业知识问答、智能客服、智能推荐、文档/视频生成等多样化的应用功能,以满足不同行业的特定需求。

例如,在交通领域,AI Agent的运用实现对交通流量的精细化调控,通过智能化的车辆监控和公路巡检系统,显著提高了交通运行的流畅性和安全性。

在政务领域,AI Agent的应用已扩展至业务办理的高效处理、热线助手服务的即时响应、以及政策解读与咨询的精准提供等,致力于提升了政务服务质量和公民满意度。

在文宣领域,利用AI Agent进行旅游智能讲解、行程规划、内容创作和舆情监控等,增强宣传效果。

在农业领域,应用AI Agent于智能农业和农产品追溯,推动农业现代化。

在教育领域,通过智能教学和学习分析提升教育质量。

在车企领域,则在自动驾驶和智能车舱等方面应用AI Agent,推动汽车行业智能化。

政企行业AI Agent技术架构的分层设计,确保了AI Agent系统的稳定性、灵活性和扩展性。通过对模型资源底座构建,AI Agent技术能力和平台层的AI Agent全流程搭建,以及应用服务层的多样化应用,政企行业能够加快AI Agent落地,实现业务的智能化升级,提高服务效率,增强核心竞争力,最终推动行业的整体发展和社会的全面进步。

(四)政企行业AI Agent实施路径

在深入探讨政企行业AI Agent技术的实施路径过程中,总结出三种核心服务模式,每种模式均针对特定的客户需求和业务环境。这些服务模式包括SaaS账号式服务、API嵌入式服务和定制化服务,三者共同构成了政企行业AI Agent技术应用的实施路径。

SaaS账号式服务为具有行业通用需求的大型客户以及对成本较为敏感的中小微企业和基层政务单位提供了高效的AI Agent技术实施路径。该服务适用于能够独立使用大型模型的应用场景,提供算力与应用一体化的账号式服务。客户按月支付服务费,费用根据功能模块和版本的不同进行分档。交付模式包括单标品受理、套餐组合以及在中小微ICT项目中的融合销售,以满足不同客户的需求。

针对拥有行业数字平台的大型客户,API嵌入式服务提供了一种将大模型能力融入客户现有系统的实施路径。此服务模式同样提供算力与应用一体化的解决方案,但交付方式更为灵活,包括一次性基础对接费用,用于与客户平台进行对接联调,之后根据客户选择的功能按调用次数或Token量进行收费。客户在其自有平台上通过API调用大模型功能,这种嵌入式服务模式不仅提高了服务的集成度,也增强了客户对模型应用的控制力和个性化能力。

对于数据安全要求高、业务需求个性化的行业大客户,如政务、央国企、金融等领域,定制化服务成为最佳的实施路径。该服务模式根据客户的具体需求,提供包括数据、定制算法、模型维护与升级、本地化部署、训推一体算力服务在内的全方位定制化解决方案。费用计算基于项目的人力投入和资源消耗,确保成本与服务的匹配度,以实现客户价值最大化。交付方式分为深度融合和模块嵌入两种,深度融合将大模型与客户平台或系统紧密结合,而模块嵌入则保持了大模型在客户系统中的独立性和可扩展性,两种方式均旨在为客户提供量身定制的AI Agent技术服务。

AI Agent平台的公有化部署相较于本地私有化部署方式,提供了更高的灵活性与可扩展性、增强的数据访问与资源共享能力、简化的系统维护与升级流程等优势。首先,在灵活性与可扩展性方面,公有化部署解决方案允许政企单位根据实时需求动态调整资源配置,有效避免了因物理硬件限制而导致的服务瓶颈。其次,该模式大幅削减了的前期投入及长期运维成本。通过实施基于使用的计费策略,公有化部署消除了昂贵的一次性资本支出需求,转而采用更为经济高效的运营支出模式,加速了新产品或服务推向市场的步伐,同时也为政企单位腾出了时间与人力资源,使其能够更加专注于自身的核心业务领域,而非陷入繁琐的技术细节之中。尽管在数据安全性和隐私保护方面,私有化部署通常被认为具有更强的表现力,但公有化部署亦采取了一系列高级加密技术和访问控制措施来确保用户信息的安全。与此同时,公有化部署方式还为跨地域团队协作提供了极大便利,促进了知识分享与创新能力的发展。

三、政企行业AI Agent 场景化应用典型案例

(一)政企行业AI Agent赋智数字治理

1.政务:高效热线服务的新时代

随着数字化时代的到来,政府部门面临着日益增长的公共服务需求与有限的人力资源。传统的政务热线面临着繁杂的咨询和投诉,导致响应时间长、处理效率低,民众的满意度受到影响。因此,利用人工智能技术提升政务热线的服务质量和效率,成为迫在眉睫的任务。

政府希望通过引入AI Agent,解决以下问题:

  • 响应时间延长:现有热线客服人员无法及时响应大量来电,导致民众等待时间过长。
  • 咨询内容复杂:热线咨询内容涵盖面广,客服人员难以应对多样化的问题。
  • 资源浪费:人工处理简单咨询占用大量人力资源,降低了整体服务效率。

为此,热线服务采纳基于大模型和自然语言处理技术的AI Agent,能够自动识别、理解和处理来电咨询,并引导民众获取所需信息或提交相关申请。

以下为主要建设方案:

  • 智能客服平台:构建一个集成AI Agent的在线客服系统,支持电话、微信、APP等多渠道接入。
  • 知识库建设:建立全面的知识库,涵盖各类政策、法规和服务流程,为AI Agent提供知识支持。
  • 数据分析:通过数据挖掘与分析,识别民众关心的热点问题,及时更新知识库内容。

27e0f12c61cb23c391cd242905b6530d图11智能政务助手流程图

通过部署AI Agent,政务热线服务的响应速度和效率得到了显著提升,平均处理时间缩短了60%,且AI Agent能够全天候在线处理简单咨询,释放了人工客服资源,使其能专注于解决更复杂的问题,从而提高了整体客户满意度达30%。AI Agent的多渠道接入功能让民众可以灵活选择最适合的咨询方式,而系统的实时学习与优化能力则通过用户反馈不断更新知识库,确保了服务的高准确性。此外,智能大数据分析为政府部门提供了决策支持,使其能够及时洞察并响应民众的需求,推动政策改进。这些措施的综合应用,不仅极大提升了服务效率,也加速了政府数字化转型的步伐,为实现更高质量和更全面的公共服务奠定了坚实的基础。

2.政法:推动法务门户智能化

根据用户在法律服务和政务系统中的需求,安徽法务门户提供了个性化的法律智能咨询服务。该AI Agent通过交互式对话,采集用户所提供的关键信息,生成咨询报告,涉及法律建议、案件分析、或者根据预设的法律文书模板自动生成完整的文书。

2ba35f99b862a17903501d35795b52fe图12 法务门户智能化功能图

c007a42fa4789ad2fa6181baf3273dfc

图13法务门户智能化功能图

法律AI Agent利用大模型、机器学习等技术,确保生成的报告符合法律要求,并能够满足用户的个性化需求。系统架构与功能设计依据用户数据的安全性和敏感性进行安全分区,保证了数据的安全管理。

法律AI Agent秉承信息集中管理的原则,避免形成“信息孤岛”,通过标准化的模板和自动化的工作流,助力用户咨询端提供全面的咨询服务,也简化政府机构、企业和法律服务从业人员简化繁琐的咨询流程。法律AI Agent报告支持多种类型,包括意见书、合同、起诉状、辩护书等。

此外,安徽法务门户在以下几个方面进行了创新:

  • 智能交互与精准信息采集:法律AI Agent通过智能对话方式来完成信息采集。这种交互不仅简化了传统信息填报的复杂流程,还能够根据用户的输入动态调整问题,确保采集到的关键信息准确无误。相比于传统的手工输入,这种智能交互提升了信息采集的效率和准确性。
  • 高效的法律报告自动化生成:法律AI Agent结合大数据分析和
  • 预设模板,能够快速生成符合用户需求的法律报告,并根据具体的案件情景灵活调整报告内容,确保文书的精准性和法律合规性。
  • 自适应的文书定制化服务:AI Agent不仅支持标准化模板生成,还能够支持用户自行上传指定的模板,根据用户的实际需求提供定制化的报告生成功能。

(二)政企行业AI Agent赋力数字民生

1.教育:助力查办一体高校服务智能升级

甘肃财贸职业学院查办一体化平台的建设背景是为了响应教育部发布的《人工智能赋能教育行动》中以大模型技术为智能教育提供有效的行动支撑的要求,基于大模型及AI Agent能力,重构传统的一站式服务大厅,为用户提供待办事项便捷入口,主要包括事项待办、工作台、服务中心、效能统计等,完成学校师生在我的日程、校园资讯、办事指南、问卷调查、公共资源下载、服务评价等多项事务,以基于大模型的低代码平台完成学校各项事项办理流程设置,提升了信息系统的建设效率。

36708ab7cc2ae3592b68743c1354cd98图14 查办一体AI Agent技术架构图

升级一网通办平台使用体验,在AI Agent的辅助下,师生通过自然语言与大模型交互,可以直接获取校内知识答案,直达学校教务系统办事入口。

21dc6857e44039266197a6f2acfaef8d

图15智慧校园应用服务示意图

e0d448e63cf9df381440d2db7926b366图16智慧校园应用服务示意图

采用面向目标的系统架构,将原有以人为中心,AI为辅助的模式变为AI为中心,人为辅助的模式,充分解放在重复性事物过程中的人力,让广大师生更聚焦教学与学习。

基于AI Agent,支持学校创建个性化助手,满足学校的个性化需求,打造具备学校特色的查办一体化平台。

d588bdcc1f8e215b02f0f8591292f347图17智慧校园应用服务示意图

以查办一体AI Agent为例,通过便捷的AI Agent编排,可以显著降低学校信息化管理人员开发和维护成本。例如,以往学校要建设多个同类的服务应用,需要进行多次开发,现在通过AI Agent能力,可以通过一次简单的流程配置,输出解决一类问题的API接口,极大的提升了信息系统的建设效率。通过查办一体化平台,让AI融入到实际的教育流程中,实现教学效率、教育关系的变化,实现技术革命。教育范式从面向过程到面向目标开始转变,意味着真正的教育智能化时代开启。

2.文宣:构建客流疏导调控畅游助手

国内旅游市场在假期面临游客聚集和安全隐患,亟需升级调控手段和系统工具。依据科技部2030年“新一代人工智能”重大项目要求,文旅部承担了解决节假日期间公众出游拥堵问题任务,致力于构建面向节假日城市旅游客流调控和智能服务支撑平台及示范项目。苏州市作为应用示范试点城市,以“游前引导错峰、游中调控错峰、游后评估”设计理念为核心,通过信令数据计算分析,结合第三方地图数据和重点景区实时数据等,构建了多源游客数据支撑;通过开发客流聚集分析、预测预警、疏导管理等实时分析技术,打造节假日城市旅游客流调控和智能服务支撑平台、面向游客的多样化智能调控服务工具和面向管理的主动疏导工具,实现旅游各环节、多渠道的客流调控与疏导。其中,面向游客的工具——畅游AI助手,采用AI Agent架构,利用大模型技术判断游客意向,规避拥堵、排队等问题,智能生成行程计划,实现“错峰引导”。

76f16d2a54a37de99992e2b458920fae

图18 畅游助手核心能力架构图

建立AI预测预警平台:利用信令、摄像头等数据实时监控,采用卷积和残差神经网络算法,实现天级和小时级客流预警;

多样化调控手段:利用5G消息、君到苏州小、一线人员调度、景区地铁广播、公交接驳和道路临时管制等调控手段,结合yolov5目标监测算法,实现景区排队时长下降。

苏州试点项目通过全域化、全场景管理工具,预知游客行前计划、感知游中行为,并实施引流调节和游后管理,形成城市涉旅智能治理技术和模式创新。解决了节假日旅游城市“缺乏适用的系统化旅游客流调控和疏导工具”问题,创新多样、便捷的管理及服务工具;为国内城市的错峰调控分流提供了基于人工智能技术的创新应用示范样本,增强人民出游幸福感,加速“畅游中国”愿景实现。

(三)政企行业AI Agent赋能数字产业

  1. 住建:政企行业AI Agent构建智慧便捷服务体系

某地住建局深入贯彻习总书记系列重要讲话精神,深入贯彻国办印发的《2022年政务公开工作要点》、国务院发布的《关于进一步优化政务服务提升行政效能推动“高效办成一件事”的指导意见》,优化政策咨询及政民服务,加强人工智能等技术运用。建设社区AI Agent服务,将智慧社区建设与AI和数字人技术相结合,为后续服务流程的重塑提供基础智能支撑,AI Agent作为服务的前沿窗口,提供数字人大屏系统,以AI驱动的数字人形象,通过语音、文字、图像生成等前沿技术,与用户进行沉浸式交互,主动提供咨询、办事指导,让群众与企业的办事体验更加个性化。助力建设智慧便捷的高效服务体系,大幅提高企业和群众办事满意度和获得感。

社区AI Agent基于某市的相关政策、生活圈数据及工作流模板为训练数据,支持语音识别及文字提问,社区居民可在各种终端进行信息查询、物业事项查询、15分钟生活圈便民查询、物业报修及动态跟踪,做到“问”“查”“听”“做”,线上24小时守候,为群众主动提供服务。

1351154909c83b78fb44c04e7420955e图19 社区AI Agent服务流程示意图

  • 问:为社区居民提供即时、精准的政策咨询服务,通过自然语言处理理解用户问题,快速检索并反馈相关政策信息。
  • 查:整合社区内外各类生活服务资源,为居民提供便捷的查询和预约服务。
  • 听:线上渠道收集居民的意见、建议和投诉,自动识别事件类型,并分派给相关部门或人员进行处理。同时,跟踪事件处理进度,及时反馈给居民。
  • 做:将社区政策智能问答、便民生活服务查询等功能模块无缝接入现有的社区业务系统(如物业管理系统、居民信息管理系统等),实现数据共享、流程协同和操作一体化。建立一个高效、规范的居民事件处理机制,对居民反馈的各类问题或事件进行统一接收、分类、分派、处理和反馈。确保每个事件都能得到及时响应和有效解决。

2. 工业:赋能中小企业数字化转型咨询

为进一步支持中小企业创新发展、加快中小企业数字化转型系列决策部署,财政部和工信部联合印发《关于开展中小企业数字化转型城市试点工作的通知》,以城市为对象支持中小企业开展数字化转型,聚焦中小企业数字化转型中的痛点难点,鼓励试点城市先行先试,探索支持中小企业数字化转型的有效模式,形成可复制、可推广的经验。

苏州作为第一批中小企业数字化转型试点城市,为深入贯彻落实《中小企业数字化转型城市试点实施指南》要求,进一步引导和推动广大中小企业加快数字化转型,全面提升中小企业数字化水平,构建苏州数字经济和数字化发展新体系,打造中小企业数字化试点“苏州样板”,针对中小企业数字化转型过程中“不想转、不会转、不敢转”的难点痛点,建设工业咨询大模型+中小企业数字化转型公共服务平台,平台为企业提供政策服务、案例推广、数转知识培训、诊断评估、供需对接等服务,助力中小企业实现数字化转型,工业咨询大模型通过引入国家、江苏省、苏州市等多级政策、行业数字化转型知识资源,对知识库结构进行优化,并通过知识库检索优化和提示工程等技术手段,打造出了专属于苏州市的数转咨询大模型,同时基于两化融合评定、智能制造成熟度评估、中小企业数字化水平评测等国家诊断标准,以2000余份实际诊断评估报告,训练诊断咨询大模型,融合公共服务平台为企业提供线上诊断能力,梳理企业现状为其指定数字化转型路径,同时与平台数据转型资源有机融合,实现精准供需对接,为中小企业数字化转型提供一站式服务。

四、政企行业AI Agent 技术与应用评价体系

在当今数字化、智能化快速发展的时代背景下,政企行业作为国家经济发展的重要支柱,其数智化转型已成为提升国家治理能力和企业竞争力的关键所在。近年来,中央和地方政府相继出台了多项人工智能相关政策文件,从顶层设计、基础设施建设、场景应用推广、标准规范制定、安全保障措施等方面为政企数智化建设提供引导和支持。随着政企数智化建设迈入深水区,整个行业在技术规范、服务水平、价值成效等方面凸显出一系列问题,业界亟需建设完备的标准和评价体系,为政企数智化建设在选型、能力、价值衡量等方面提供规范化指引和参考依据。

(一)政企行业AI Agent关键技术评价指标

AI Agent作为AI领域的一种重要应用形式,其性能和效果直接关系到业务处理效率、用户体验及企业的竞争力。因此,制定一套科学、全面的评价与衡量规范,对于指导AI Agent的研发、优化及应用具有重要意义。

1.AI Agent规划能力评价

AI Agent技术能力的评价围绕规划能力、记忆能力和执行能力展开,对于衡量AI Agent的规划能力的具体作用,涵盖任务分析与分解能力、最优规划决策能力和外部资源协调能力,具体如下:

  • 任务分析与分解能力,即将复杂的任务拆解成一系列更小、更易于管理的子任务。
  • 最优规划决策能力,即通过评估不同计划结果和资源消耗选择最合适的计划。
  • 外部资源协调能力,即高效地准确地调用外部资源或者工具来辅助其完成任务。

2.AI Agent记忆能力评价

对于衡量AI Agent的记忆能力,评价应包括短期记忆与长期记忆、记忆的准确性、记忆的可访问性、记忆的更新能力、记忆的泛化能力,共同保障AI Agent高效存储、准确检索并灵活应用信息,具体如下:

  • 短期记忆与长期记忆,短期记忆方面评估AI Agent在处理当前任务或会话时,能够存储和快速访问的信息量。长期记忆方面,考察AI Agent在长期存储和召回信息方面的能力。同时,要评估内部存储结构和外部存储资源的限制,衡量AI Agent能够存储信息的总量。
  • 记忆的准确性,评估AI Agent在存储和召回记忆信息时,信息的准确性和完整性,特别是在长期存储之后,信息的完整性和准确性,需要定期检查和测试。
  • 记忆的可访问性,即AI Agent在需要时能够快速检索和使用正确记忆信息的能力。
  • 记忆更新能力,考察AI Agent在接收新信息时,能否及时更新其记忆库并删除过时或无效的信息,需要通过观察AI Agent在处理新任务时的表现来验证。
  • 记忆的泛化性,AI Agent能够将记忆中的信息应用到新情境中的能力。

3.AI Agent执行能力评价

对于评估AI Agent的执行能力,应注重执行准确的、执行速度和执行反馈机制衡量AI Agent的执行效果,具体如下:

  • 执行准确度,即AI Agent在执行任务时,其动作是否准确、稳定,能否达到预期的效果。
  • 执行速度:评估AI Agent在完成任务时所需的时间,包括从任务接收到动作完成的全过程。
  • 执行反馈机制:在执行任务过程中,是否能及时、准确地反馈执行状态和结果,以便用户或系统了解任务的进展情况。

4.AI Agent综合效果评价

AI Agent效果评测应综合考虑任务完成准确率、用户满意度、学习和进化能力、响应速度、稳定性和用户界面的友好性与易用性,通过这些指标评估AI Agent的性能和用户体验,确保其在实际应用中能够高效、可靠地满足用户需求。

  • 任务完成准确率,包括AI Agent系统整体任务完成的准确率,还包括系统里面各个核心模块的准确率,如意图理解、图像识别、检索、等模块的准确率。
  • 用户满意度,通过用户调查或反馈机制,了解用户对AI Agent能力的满意度和反馈。
  • 学习和进化能力,即评估AI Agent是否具备从历史经验中学习并提升自身能力的能力,评估AI Agent是否能在不断变化的环境中,通过自我进化来适应新的任务和需求。
  • 响应速度,测量AI Agent对用户请求的响应速度,快速响应时间可提高用户体验和工作效率。评估AI Agent在单位时间内能够处理的任务数量,尤其适用于处理大量数据或高并发请求的场景。
  • 稳定性,观察AI Agent在长时间运行过程中的稳定性,评估其是否会出现频繁的故障或错误,测试AI Agent在面对错误输入或异常情况时的表现,确保其能够正确处理错误并给出合理的反馈。
  • 服务友好性,评估AI Agent的用户界面是否友好、易于操作,用户是否能够轻松地与AI Agent进行交互。

(二)政企行业AI Agent平台评价指标

在政企行业中,AI Agent平台评价指标直接关系到业务流程的构建、优化、成本的降低以及服务质量的提升,使AI Agent平台能够高效、稳定且安全地服务于政企客户。

本章节重点讨论五个核心评价指标:易用性和效率、功能健全性、性能表现、可拓展性以及安全性。

  1. 评估易用性和效率是确保政企行业AI Agent平台能够被广泛采纳和高效使用的关键。政企行业AI Agent平台应当具备直观、易懂的用户界面,提供清晰的操作指引和详细的文档支持,以帮助用户快速上手并熟练掌握平台的各项功能。此外,政企行业AI Agent平台应支持拖拽式、流程图编排以及所见即所得的开发方式,使用户能够无需编写大量代码即可迅速搭建和定制所需的行业AI Agent。这些设计大幅降低了技术门槛,并提升开发效率,使非技术人员也能参与到AI Agent的创建和维护中来。通过这种方式,平台能够更好地满足政企行业用户的需求,提高整体的工作效率和用户体验。
  2. 评估功能健全性是全面评价政企行业AIAI Agent的全流程建设及优化能力,聚焦于AIAI Agent的应用创建、能力配置及发布优化。多种AI Agent应用创建方式,包括但不限于自主规划模式和工作流模式,前者通过应用配置界面完成设定并依靠大模型自主思考和规划完成任务,后者通过工作流编排实现功能且用户的所有对话均会触发相应的工作流处理。AI Agent应用能力配置,即支持角色配置、多种组件添加方式、对话初始设置、模型选择与效果配置、回复配置、工具配置等,以实现高度个性化和灵活的功能定义。AI Agent应用优化,即支持数据干预和规则干预的回复优化,包括采纳问答的自动调取、干预数据的管理以及按规则自动回答,以实现对话效果的持续调优。
  3. 评估性能表现是确保AI Agent平台能够在实际应用中高效、稳定运行的重点。平台的性能直接影响用户体验和业务连续性。首先,需要测试平台在处理请求和生成响应时的速度,以评估其是否能够满足实际业务需求。高效的响应速度可以显著提升用户体验,减少等待时间,提高整体工作效率。其次,检查平台在长时间运行和高并发场景下的稳定性和可靠性,以及是否具备故障恢复和容错机制。高稳定性和可靠的故障恢复机制能够确保平台在面对大量请求和复杂环境时依然能够平稳运行,避免因系统崩溃或故障导致的业务中断。
  4. 评估可拓展性是确保政企行业AI Agent平台能够适应不断变化的业务需求和技术环境的前提。一个具有良好可拓展性的政企行业AI Agent平台应当支持自定义插件和API,允许用户根据具体需求灵活扩展功能,增强平台灵活性,使用户能够根据业务发展进行定制化开发,从而更好地满足特定场景的要求。此外,平台应具备与其他系统和工具的高度兼容性,并能够轻松集成到现有的工作流程中。这种兼容性和集成能力可以确保平台无缝融入企业的数字平台,减少迁移和整合的成本,提高整体系统的协同效率。通过可拓展性评估,确保政企行业AI Agent平台在未来能够持续适应新的技术和业务需求,
  5. 为政企提供长久的支持。考察安全性是确保用户数据和通信安全、防止潜在威胁的重要保障。政企行业AI Agent平台应当采用多层次的安全保障措施,包括数据加密、访问控制、身份验证、审计日志等,以全面保护用户数据和通信的安全。此外,平台应定期进行安全性测试,包括渗透测试、漏洞扫描等,以确保及时发现并修复任何潜在的安全漏洞。通过这些措施,有效防范数据泄露、未授权访问和其他安全风险,保障用户信息的完整性和隐私,增强用户对平台的信任。

五、政企行业AI Agent 大规模应用痛点和解决思路

(一)应对不稳定、不可靠问题,AI Agent建设更趋标准化、安全化

目前,AI Agent的应用尚不足以展现出充分的自主思考能力来应对复杂环境。对于AI Agent技术框架而言,自主思考和策略规划构成了AI Agent的核心特质。当前大部分AI Agent应用工作流设计遵循RPA(RoboticProcessAutomation,机器人流程自动化)的逻辑,高度依赖人工介入和预定义规则。在复杂情境中,大模型的推理能力有限,仅能在明确和详尽的指令指导下保持稳定性能。

未来,一是通过扩展通用及政企行业的工作流程将是提升AI Agent行动力稳定的关键。由于对大语言模型推理与规划能力的认知仍有待探索,明确的工作流实际是AI Agent行动能力的关键部分。抽象并标准化流程,将其转化为经验数据,是促进AI Agent向自动化与智能化演进的关键步骤。此举将增强AI Agent在应对复杂业务场景时的独立决策能力及环境适应性,进而提升其在流程自动编排并选择合适工具的效率。

二是通过健全AI Agent安全模块,包括但不限于强化检测机制和阻拦机制等措施,可以显著提升政企行业AI Agent应用的安全性和可靠性。在检测机制方面,从内容上来说,AI Agent在接收用户输入时,通过安全检测模块进行多层过滤,防止恶意数据或敏感信息的注入。同时对输出的数据同样进行严格处理,以确保不会泄露后端系统的敏感信息。最重要的是,检测出大模型输出的不受信任的内容或者“幻觉”并进行预警。安全检测模需要实时监控和识别潜在的安全威胁。从系统来看,AI Agent应采用多层次的安全监控体系,实现对网络流量、应用程序行为和系统日志的实时监控与分析。此外,利用行为分析和异常检测技术,建立基于用户和系统行为模式的安全基线,及时发现偏离正常模式的行为,从而快速响应潜在威胁。而在阻拦机制上,则需要设计自动化响应机制,在检测到内容方面和系统方面的风险时能够自动采取封锁、隔离等措施,最大限度地减少损害。

三是针对AI Agent在政企行业知识回答的需求,需持续建设丰富、专业且高可用的知识库。在金融、政务、能源、建筑等领域,回复准确性要求高,因此需通过反馈优化和数据回流等机制,不断改进和完善,以保障AI Agent回复的稳定性和准确性。

(二)应对复杂问题处理效率性,多AI Agent协同能力将持续加强

Agent2Agent协议的提出,为多AI Agents协同能力的提升提供了关键技术支撑。随着业务需求日益复杂化和多元化,单一AI Agent难以独立应对跨领域、多层次的挑战。通过Agent2Agent协议构建的标准化协作框架,多AI Agents系统能够将复杂问题分解为更小、更易管理的子任务,实现专业化分工与高效执行。

Agent2Agent的核心价值在于打破AI“孤岛”困境,通过统一的通信协议和协作机制,使不同来源、不同功能的AI Agent能够无缝协作,共同提升任务成功率与用户体验。

首先,角色分配专业化与动态任务拆解是协同效率的核心。Agent2Agent协议通过“发现机制”让AI Agent自动识别彼此能力,如天气查询、路径规划、资源调度等,并基于任务需求动态分配角色。例如,未来在旅行规划场景中,天气助手、地图助手与酒店助手可通过Agent2Agent的消息传递与任务拆分模块,可实时共享信息,如天气数据、交通状态等,并协同生成最优方案。这种分工模式既避免了重复劳动,又确保每个AI Agent发挥其专业能力,显著提升整体执行效率。

其次,协作机制的优化需兼顾激励与约束。A2A协议通过定义标准化的“内容块”与“产物”格式,确保AI Agent间信息传递的准确性和一致性。此外,通过设计层次化协作结构,如主AI Agent协调子AI Agent,可减少通信开销并提升灵活性。例如,未来在企业招聘场景中,简历筛选、面试安排、背景调查的AI Agent通过Agent2Agent协议分层协作,既降低任务冗余,又能动态调整优先级。

最后,通信机制的标准化与自适应学习是关键突破点。Agent2Agent协议不仅定义了AI Agent间的消息传递规则,还支持长周期任务,如供应链管理等的持续协作。例如,库存监控AI Agent与需求预测AI Agent可通过Agent2Agent的“反向传播”机制,实时共享数据并动态调整补货策略。同时,结合强化学习,AI Agent可基于Agent2Agent协议的奖励机制,如任务完成度、资源消耗率,优化协作策略,实现知识共享与共同进化。未来,随着Agent2Agent与MCP等协议的协同应用,多AI Agents系统将能更高效地调用外部工具与数据,进一步拓展复杂问题的解决边界。

(三)应对多元发展需求,多模态AI Agent、具身智能将成为解决思路

现阶段,以语言大模型为核心的政企行业AI Agent在政务、住建、交通、应急、政法、农业、教育等领域以初见成效,不仅能够提供了高效便捷的服务,还取得了积极的反馈结果。然而,现在广泛存在的单语言模态的AI Agent只能处理和理解单一类型的数据,现实世界中的信息却是多模态的,这限制了AI Agent对复杂环境的理解和反应能力。

未来,随着多模态大模型能力的增强及其与AI Agent的融合,将显著增强AI Agent在信息处理领域的核心竞争力,从而实现从简单的感知向深层次的认知转变,并持续深化已应用场景,不断探索其在更多领域的广泛应用机会。

在城市治理中,多模态AI Agent的应用将进一步提升城市管理的精细化水平。AI Agent可以通过视频监控识别交通拥堵、违章停车等问题,并通过语音提示和显示屏发布信息;同时,通过与物联网设备的联动,AI Agent可以实时收集环境数据,如空气质量、噪音水平等,从而为城市管理者提供决策支持,优化资源配置。

此外,AI Agent还可以在公共安全、环境保护等方面发挥作用,通过多模态感知和分析,提供更加全面的城市管理解决方案。例如,AI Agent可以监测城市中的异常活动,及时预警并协助相关部门采取措施,保障城市的安全与稳定。

同时,具身AI Agent和适应性机器人系统的发展可以彻底改变从工业、农业、医疗等多个行业,可能缓解劳动力短缺并提高效率。

在医疗保健方面,利用大语言模型和视觉大模型作为诊断助手或患者护理助手有望带来更准确的诊断、改善患者护理,并提高在欠发达地区的医疗服务可及性。在智能工业和服务业领域,随着多模态感知、多AI Agent协同及大模型等关键技术的不断突破,具身智能将能够更加精准地理解和适应复杂多变的实际工作环境。这不仅会显著增强工业生产的灵活性与效率,同时也将在服务行业中带来更加个性化和贴心的用户体验。

(四)应对建设成本问题,AI Agent平台即服务有望成为主流服务模式

随着云计算技术的成熟和普及,越来越多的企业开始转向基于云的服务模式,以获取更高的灵活性、可扩展性和成本效益。AI Agent平台及服务模式正是这一趋势下的自然延伸,它不仅提供了计算能力和存储资源,还集成了知识库、工具配置和可视化AI Agent应用搭建方式,支持快速开发、测试和部署AI Agent应用。

AI Agent平台通过集中管理和维护基础设施,使得政企用户无需投入大量资金购买和维护昂贵的硬件设备。这对于预算有限或希望将更多资源集中在核心业务上的组织来说尤为有利,避免了传统本地化部署中常见的前期高额投资和后期闲置资源浪费的问题。除此之外,AI Agent平台还具备良好的可扩展性和弹性伸缩能力,可以根据实际需求自动调整资源分配,确保应用在面对流量高峰或低谷时都能保持稳定的性能表现。这种特性对于那些业务量波动较大或季节性强的政企机构尤其重要,它们能够在高峰期获得充足的资源支持,而在低峰期则能有效控制成本。

然而,要使AI Agent平台即服务(AI Agent as a Service)模式真正成为主流,还需要克服一些潜在的挑战。一是数据安全和隐私保护问题,尤其是在处理敏感信息时,如何确保数据在云端的安全传输和存储是一个亟待解决的问题。为此,平台提供商需要采用先进的加密技术和严格的安全措施来保护用户数据。二是兼容性和定制化需求,虽然平台提供了丰富的标准服务,但在某些特定场景下,用户可能仍需要一定程度的定制化支持。因此,平台应具备足够的开放性和可扩展性,允许开发者根据自身需求进行二次开发和集成。

随着技术的不断进步和市场的逐步成熟,AI Agent平台即服务有望成为连接技术创新与商业实践的重要桥梁,推动政企行业迈向更加智能、高效和可持续发展的新阶段。

(五)为推动行业生态健康发展,AI Agent应用相关标准体系将持续丰富

标准和评价体系是推动政企行业AI Agent高质量发展的重要力量,第三方机构应加快构建政企行业AI Agent相关标准和规范体系,指导政企行业AI Agent建设、应用、评价等各环节,推动政企行业AI Agent发展“有据可依”。

中国信息通信研究院围绕政企行业AI Agent领域积极开展标准研制。面向供给侧,开展《政务AI Agent开发应用平台成熟度模型》、《政务服务大模型应用能力要求》、《智能公文写作大模型应用能力要求》、《基于大模型的智能助手AI Agent能力要求》《智能体即服务(AI Agent as a Service)能力要求》、《智能体通用技术能力要求》等标准研制,旨在衡量服务商提供政企行业AI Agent相关产品和服务的可信能力;面向需求侧,开展《IOMM-G政务AI Agent建设和应用效果成熟度模型》、《IOMM企业级AI Agent建设和应用成熟度模型》标准,为政企行业AI Agent的应用成效和价值衡量提供“标尺”。

同时,相关评估体系的落地和推广将进一步巩固政企行业AI Agent建设案例的引领作用,提高其可信度和可靠性,增强用户和企业的信任感。未来,随着政企行业AI Agent标准与评估体系日臻完善,将会进一步推动政企行业AI Agent健康有序发展。

来源:中国电信政企服务

69f39b38901b5e3b167d45beff8dbe99下载本白皮书,请在公众号“智慧城市行业分析”留言回复“政企行业Agent研究报告”

【END】

为您推荐

发表回复