2025爱分析·Agent厂商全景报告:最新版厂商全景地图

1、研究范围定义

研究范围

当前,全球科技格局正在经历一场由生成式人工智能驱动的深刻范式革命。智能体(Agent)的崛起,被视为继大语言模型(LLM)后,AI技术迈向自主决策和复杂任务执行能力的关键飞跃。Agent不再仅仅是辅助人类进行内容生成的工具,而是能够自主理解目标、制定规划、并利用外部工具采取行动的复合系统。

从技术内涵来看,现代Agent的突破性架构可解构为四大核心要素:LLM(大模型,提供推理与语言理解核心)+ 规划能力+记忆模块+外部工具。正是这种结构,使得Agent能够通过访问实时数据、调用外部API并维持任务的长期一致性与准确性,从而实现复杂流程的自动化,即自主智能体。这种能力上的质变,使得Agent区别于传统的聊天机器人或需用户全程监督的AI助理,后者通常在用户的请求或提示下运行,而最终决策权仍在于用户。Agent的出现,标志着AI应用正在从被动响应式工具,转向具备主动性、能够实现任务闭环的执行系统。

这一技术范式革新恰逢国家战略布局的关键时期。关于制定国民经济和社会发展第十五个五年规划的建议,明确提出了“全面实施‘人工智能+’行动”。这一行动旨在“以人工智能引领科研范式变革”,并“全方位赋能千行百业”,抢占人工智能产业应用制高点。在这一战略框架下,Agent扮演的角色绝非简单的效率工具,而是驱动“发展新质生产力”的核心引擎。其战略意义在于,Agent通过推动数据转化为能够创造价值的新型生产要素,并从根本上重塑劳动力、资本等传统生产要素的价值与配置,最终实现全要素生产率的显著提升,进而服务于中国式现代化建设。

智能体的发展已上升至国家战略高度,并被赋予明确的普及目标。国务院于2025年8月印发了《关于深入实施“人工智能+”行动的意见》(以下简称《意见》)。该《意见》对智能体的战略意义和推广速度进行了系统部署,旨在“推动人工智能与经济社会各行业各领域广泛深度融合,重塑人类生产生活范式,促进生产力革命性跃迁和生产关系深层次变革”。《意见》为智能体的普及设定了极具前瞻性和确定性的量化目标,将Agent提升至“新基础设施”的地位:

  • 2027年,新一代智能终端、智能体等应用普及率需超过70%
  • 2030年,新一代智能终端、智能体等应用普及率需超过90%

如此高的普及率目标意味着智能体不再是可选项,而是构建“人机协同、跨界融合、共创分享的智能经济和智能社会新形态”的基础性要求。政策的强制性引导和高确定性目标,为Agent市场的规模化应用和持续创新提供了坚实的政策红利和广阔的赛道空间。市场主体必须认识到,智能体的推广已成为国家深化产业创新、促进技术普惠和成果共享的关键机制。

在此背景下,爱分析对Agent市场进行了系统研究和重新梳理,形成了最新的《Agent市场全景地图》,以可视化形式描绘了当前市场的核心细分赛道,为产业参与者提供了结构化、前瞻性的市场参考。

0630a6d744861556729cc849366368f6

本报告重点选取对话式智能分析Agent、智能办公Agent、营销Agent、陪伴式智能硬件、数字人Agent、Agent开发管理平台和对话式AI等7个市场进行深入研究,旨在通过对这7个重点市场的分析,揭示Agent技术在特定领域的应用情况以及代表性厂商的核心竞争力,为企业用户提供有价值的参考。

厂商入选标准

本次入选报告的厂商需同时符合以下条件:

  • 厂商的产品服务满足各市场分析的厂商能力要求;
  • 近一年厂商具备一定数量以上的企业付费客户(参考第3章各市场分析部分);
  • 近一年厂商具备一定规模以上的相关收入(参考第3章各市场分析部分)。

(注:“近一年”指2024年Q4至2025年Q3)

2. 厂商全景地图

爱分析基于对甲方企业和典型厂商的调研以及桌面研究,遴选出在Agent市场中具备成熟解决方案和落地能力的入选厂商。

32006432c95c10b0fd5cdb04060227c5

3. 市场分析与厂商评估

爱分析对本次Agent项目重点研究市场做如下分析。同时,针对参与此次报告的部分代表厂商,爱分析撰写了厂商能力评估。

3.1 对话式智能分析Agent

市场定义:

对话式智能分析Agent是基于大模型和Agent技术,以自然语言交互方式,实现企业数据查询、敏捷分析、深度洞察与自动化报告生成等功能的新一代智能分析解决方案。

甲方终端用户:

包括企业管理层、业务部门,以及数据分析师,他们希望通过对话式平台代替传统的BI工具和手工代码,实现更高效、更深度的自助式数据分析。

甲方核心需求:

主要集中在提升全员用数效率、支持高层决策以及实现更深层次的业务洞察和优化建议等方面。此外,IT部门也关注Agent平台在企业AI生态中的统一性和兼容性。

  • 洞察驱动决策:从数据查询到问题解决思路的全链路支撑。企业不满足于Agent只是简单地查询数据,而是希望借助大模型的深层分析能力,实现更高效的深度洞察。 Agent应能够提供分析思路、帮助用户洞察数据背后的问题根因、定位问题,并给出解决问题的思路 ,甚至提出优化业务动作的建议 ,从而形成从数据到决策的完整闭环。
  • 敏捷高效用数:打破传统数据需求的沟通壁垒与漫长等待周期。这是普遍且务实的一类需求。在传统模式下,业务方提出需求后,需要经历一个等待周期才能得到满足,不够敏捷。客户寄希望于Agent能找到一条路径,让需求的表达和满足都变得更加顺畅和敏捷 ,从而加快业务用数的效率 ,实现全员数字化的敏捷性和灵活性。
  • 顶层决策支持:为一把手看数提供直观、快捷的AI落地形式。这类需求相对直接,主要诉求是落地AI ,以便给领导看数。这在央国企和部分金融企业中较为普遍。企业希望利用Agent的对话能力,将固定报表信息或核心指标的查询,转化为对话式的交互方式 ,以满足高层对数据快速、直接获取的需求。
  • AI生态统一:实现多Agent系统的兼容互通与底座统一。甲方的IT部门在考虑AI项目时,倾向于在统筹层面进行规划。他们不希望AI项目“百花齐发”、各自独立 ,因此要求Agent平台能够提供大的底座或MCP服务 ,强调产品间应具有更好的生态兼容性 ,能快速接入智能问答、知识库等其他AI服务。

厂商能力要求:

厂商应具备强大的数据工程和企业级治理能力,以保障结果的可靠性和系统的性能。

  • 准确性与灵活性兼顾:不仅要查得准,更要查得全、查得深、查得活。这是客户问Agent的第一件事 ,因为问数的容错度非常低。厂商不能仅为了准确性而采取“写死”的固定查询方案 ,那将退回传统固定报表模式,成为伪需求。真正的能力要求是:在保证准确性的基础上,实现查询的灵活、全面和深入 ,从而满足客户不断迭代的分析和策略探索需求。
  • 深层数据工程支撑:大模型+语义层/指标平台构建可靠的数据中介。客户关注厂商与数据工程的结合方式。大模型本身无法替代复杂的数据工程 ,企业数据的体系建设水平和数据质量是决定查询准确性的前提。厂商需要提供高效、高质量的取数工作流 ,例如通过指标平台的语义层 作为语义中介,而非完全依赖大模型直接生成SQL,以确保数据可查准和可控。
  • 极致查询响应速度:解决海量数据查询的耗时痛点。除了准确性,客户还要求查得快。由于数据分析涉及从数仓中捞取海量数据 ,因此不同于业务应用端的快速返回,Agent需要具备高效的数据处理和查询优化能力,以应对数据量大带来的查询延迟问题。
  • 企业级权限管控:保障数据安全和个体使用范围的边界清晰。作为企业级应用,Agent必须具备严格的数据权限管控能力。厂商需要能够为每一个业务人员提供服务 ,并确保每个人员都能在自己的权限范围内进行查询和分析 ,防止数据权限的泛滥或滥用。

入选标准:

  1. 符合对话式智能分析Agent市场分析的厂商能力要求;
  2. 近一年厂商在该市场至少服务3家企业;
  3. 近一年厂商在该市场的收入规模至少在100万元。

 

代表厂商评估:

81f0b6dde0967d8a2563591829f6a09d

Aloudata

厂商介绍:

Aloudata 大应科技是一家自动化数据管理软件提供商,国内 Data Fabric(数据编织)架构理念的实践者与引领者,业内首倡 NoETL 数据工程模式,自研了包含逻辑数据编织平台、主动元数据平台、自动化指标平台及分析决策 Agent 在内的 NoETL 产品家族,并在金融、零售、制造、航空、能源、交通等行业落地应用,帮助企业重塑 AI-Ready 的数据基建,实现可信的智能决策。Aloudata 被 Gartner、IDC 等国际知名研究机构列为数据编织、数据资产管理及 “GenAI+Data” 等领域的代表厂商。

产品服务介绍:

Aloudata Agent 是一款对业务用户友好的对话式分析决策智能体。该产品以“ NoETL 明细语义层+多 Agent ”架构为支撑,通过独创的 NL2MQL2SQL(MQL:Metric Query Language)技术路径,解决了企业直接采用大模型进行数据查询时普遍存在的“数据幻觉”问题,精准对齐业务语义与数据语言,实现以指标中心的对话式数据分析。

Aloudata Agent 首先能够精准理解业务意图,生成指标语义查询 MQL,随后由指标语义引擎将 MQL 自动转化为 100% 准确的 SQL 语句,结合智能物化加速策略,高效、准确输出数据结果。指标语义引擎还会通过查询 API 鉴权,核查业务对查询指标、维度及相关数据的权限,保障数据安全。

05ff42b699548208c48c70662cfc7a30

Aloudata Agent 提供明细级维度归因和智能因子归因能力,帮助业务快速定位问题源头。针对复杂分析任务,Aloudata Agent 还可自动制定分析思路和任务规划,生成包含数据结果查询、异常发现、归因、对比与改善措施建议的结构化报告,将数据洞察转化为可执行的业务动作。Aloudata Agent 通过“智能问数(是什么)-智能归因(为什么)-智能报告(怎么做)”的分析闭环和场景化的分析助手精准赋能业务决策与创新,推动企业数据民主化。

厂商评估:

Aloudata 是一家以数据工程自动化为基因的厂商,其对话式分析决策智能体 Aloudata Agent 不是一个孤立的 AI 应用,而是构建于其成熟的指标平台和 NoETL 工程架构之上的自然延伸。其核心特点在于,通过在大模型与数据仓库之间引入一个强大的 NoETL 明细语义层作为数据底座,在架构层面解决了大模型直接查询数据所带来的准确性和灵活性难题。

该产品在设计上注重分析过程的透明化与用户干预能力、场景知识沉淀与隔离能力,以及交互式引导和追问,并支持构建场景化数据分析助手,旨在提升业务在灵活探索数据时的信任度与掌控感。

2f2e3dbfca7a49a8e231b96383e5f82d

图:Aloudata Agent 整体架构

  • 以 NoETL 明细语义层为数据底座,解耦大模型的不确定性与数据分析的严肃性。

Aloudata Agent 的 NL2MQL2SQL 技术路径,是在大模型和底层数据源之间增加了 NoETL 明细语义层。这一设计规避了让大模型直接生成 SQL 查询数据库的普遍做法。在此架构下,大模型的核心任务被限定在它所擅长的自然语言理解和用户意图识别上,它负责将用户的提问转换成对指标语义层的查询逻辑(MQL)。

而后续所有对数据准确性、查询性能、权限安全等要求极高的“确定性”工作,则交由后端更可控、更成熟的指标语义引擎来完成。该引擎负责将 MQL 精准地转化为查询 SQL,选择最优的查询路径并与底层数据仓库交互。这种架构,本质上是将大模型的不确定性与数据分析的严肃性进行了解耦,是能够保障查询准确性和查询性能的关键所在。

借助于 NoETL 明细语义层的能力,用户无需提前预定义大量派生和衍生指标,仅定义基础指标和维度即可。Aloudata Agent 在识别问数意图后,可动态生成指标和维度的各种组合、筛选条件和衍生计算逻辑,以原子粒度的语义要素的动态组合来满足无限的分析可能。

  • 对话式分析能力“长”在 NoETL 数据工程之上,不是浮于表面的“大模型套壳”。

如前所说,Aloudata Agent 是构建于成熟的指标平台和 NoETL 工程架构之上的自然延伸。这意味着,该产品不是简单地为大模型包装一个问答界面,而是一个向下扎根的完整的数据准备、治理、查询和分析的体系工程。它的能力不止于前端的自然语言交互,还内嵌了后端的ETL 自动化、查询加速、数据建模规范等一系列数据基础设施的核心能力。

这一特性使其有能力系统性地解决对话式分析中的工程难题。例如,面对海量数据的复杂查询,“查得快”依赖于其指标引擎的自动化物化和查询路由能力;而保障数据不越权、口径一致的“管得住”,则依赖于其指标定义和权限管控能力。这种深度的工程基因,构成了区别于单纯 AI 应用厂商的核心壁垒。

  • 产品设计注重“可解释性”与“可干预性”,致力于将分析过程的主导权交还用户。

针对大模型作为“黑盒”所带来的普遍信任问题,Aloudata Agent 在产品交互层面做了特别设计。它允许用户清晰地看到大模型对查询意图的理解过程,包括识别了哪些指标和维度,从而判断其理解是否准确,避免“数据幻觉”。

同时,产品提供了一系列用户干预机制。当模型对用户的模糊问题无法准确识别时,它会通过“反问”的方式与用户进行二次确认;用户也可以在生成图表后,随时调整查询的条件、维度或指标。此外,交互式的下钻分析、引用上下文进行追问等功能,也让整个分析过程不再是“一问一答”式的被动接收,而是由用户主导的、逐步深入的探索过程。这些设计旨在降低AI应用的使用门槛,并构建业务人员对查询结果的信任感。

  • 深度适配业务场景支持创建个性化数据分析助手,更贴合业务需求和分析习惯。

在企业真实的业务经营、管理中,门店运营、区域管理、财务、人力等角色所关注的问题、使用的术语、依赖的数据完全不同,所以一个“通用型”的数据分析助手已难以满足深度业务需求。

对此,Aloudata Agent 深度融合专业领域业务知识,可以按照不同业务职能或数据领域,帮助不同业务角色在统一数据底座上,创建个性化的智能数据分析助手,如门店数据助手、财务分析助手、区域经营数据助手、人资数据助手,更直接地获取所需的数据和分析报告。

1bec7f4fce73d17cd5ef804cca20921b

典型客户:

某国家大型基础设施建设和运营央企、某头部品牌服饰企业

 

ea6ecb817e654f538351bd0fcb9c0938

思迈特软件

厂商介绍:

广州思迈特软件有限公司(Smartbi)成立于 2011 年,专注于智能数据分析领域。作为国内领先的商业智能(BI)和AI应用厂商,思迈特致力于提供基于Agent BI 的数据分析平台和解决方案,尤其在金融 BI 市场占据领先地位,并服务于央国企、制造等高价值行业。

产品服务介绍:

作为思迈特软件核心产品之一,白泽智能 BI 平台(Smartbi AIChat)以 “智能体平台 + 数据智能体应用市场” 的创新形态实现突破性迭代。平台底层搭载支持工作流编排、多智能体协作与 RAG 知识库管理的全栈技术底座,深度封装多年沉淀的指标模型、数据模型及 BI 分析能力为可灵活调用的插件,通过工作流引擎即可接入各类数据分析插件与第三方 MCP 服务,快速构建分析、专家、报告等场景化数据智能体。同时,产品兼容标准 MCP、A2A 协议,具备双向开放扩展能力,既能接入外部工具丰富功能矩阵,也可向第三方系统开放核心分析能力,构建开放融合的智能分析生态,为企业提供从数据查询、深度洞察到决策落地的全链路智能支撑。

厂商评估:

思迈特软件在对话式智能分析 Agent 市场的竞争优势主要体现在其深厚的BI基础和对 Agent 技术体系化的应用。凭借在金融、央国企等行业积累的头部客户资源和完善的企业级指标体系,思迈特构建了面向复杂分析场景的多智能体协同平台。其核心能力在于将传统 BI 的多维计算、数据治理与指标体系构建能力以及大模型的自然语言理解、推理规划能力有效结合,形成涵盖“分析智能体”、“专家智能体”和“自定义智能体”的层次化解决方案,具备较强的技术落地基础和行业经验沉淀。

  • 优势在于深厚的 BI 基础,而非单纯的大模型能力。思迈特作为资深的商业智能厂商,其对话式 Agent 业务不是从零开始,而是构建在成熟的企业级数据分析平台之上。这种 BI 底座的优势体现在对企业数据资产(尤其是指标体系)的深刻理解和管理上。Agent BI 的准确性和可靠性,很大程度上依赖于底层统一的指标口径和数据模型,而这是传统BI厂商的核心竞争力。这种结合避免了单纯依赖大模型在企业数据中“盲查”的弊端,保证了分析结果的业务规范性和数据一致性,为 Agent 的复杂计算和逻辑推理提供了坚实、可信的数据基石。因此,思迈特的 Agent 产品在解决业务规范性和数据质量要求高的企业级应用中,具有结构性优势。
  • 构建多智能体协同框架,覆盖从明确查询到模糊决策的完整分析链。Smartbi AIChat 已发展至 V4 版本,Smartbi AIChat V4 采用多智能体架构,通过“智能助理”统一入口,自动路由至不同职能的 Agent。例如,“分析智能体”专注于高效率、精确执行用户对明确指标的查询和可视化需求,实现“快准稳”的执行;“专家智能体”则承担更复杂的角色,能够破译模糊、开放式的业务问题(如“分析经营情况”)进行任务拆解、归因穿透、预测建议,并生成结构化的报告;“自定义智能体”聚焦个性化场景适配,可生成指向性报告,支持开放式追问等,助力用户对分析主题进行深度探索与挖掘。
  • 采用 RAG 技术深化企业知识储备,有效提升 Agent 的业务语境理解力。为了解决 Agent 作为“新员工”不理解业务的问题,思迈特通过全面的 RAG技术将企业私有数据、指标模型、表结构等转化为知识图谱进行存储。这种机制使得 Agent 能够迅速掌握业务数据和关联关系,成为“企业业务通”。知识储备还包括专业的行业知识模板和复杂查询案例的积累,并通过用户反馈进行实时调优和自学增量更新。这种机制显著提升了 Agent 在处理业务问题时的精准度、减少了歧义,并保证了输出结果的业务相关性和深度。
  • 技术栈具备开放性和可扩展性,支持与客户IT生态的深度集成。平台在技术实现层面展现了较高的开放性。例如,系统支持 NL2Python 的代码生成能力,并允许灵活调用第三方插件,以及通过 Spark 自定义流程和Python 沙盒进行深度分析和机器学习能力的扩展,而非将所有计算能力封闭在 Agent 自身内。此外,针对大型企业客户的高性能和安全要求,Smartbi AIChat V4 新增了对客户自有向量数据库的接入支持。这不仅解决了内置轻量级向量库的性能瓶颈,也提升了系统在多节点集群场景下的扩展性和灵活性,体现了其在大型项目落地方面的工程化考量。
  • 客户群体聚焦高价值行业,有利于形成行业应用壁垒。思迈特的客户结构以金融、头部制造企业、央国企等为主,这些行业具有数据密集、分析需求复杂的特点,且对数据安全和产品成熟度要求极高。凭借在金融行业的深度客户沉淀与场景实践,思迈特逐步形成行业领先优势,其 Agent BI 产品不仅获得金融、央国企等标杆客户的实践验证与认可,更在真实复杂场景中完成了技术迭代与能力闭环。通过将高价值客户的业务需求与产品技术深度融合,思迈特 Agent 平台构建了“行业业务知识 + 场景化解决方案”的双重壁垒,核心竞争力持续凸显。此外,以金融行业积累的成熟能力与品牌认可为基础,联合浪潮云、智谱等生态伙伴展开战略合作,其 Agent 能力已实现跨平台、跨场景的集成应用,成功切入更多行业的企业AI转型大单,市场覆盖边界持续拓宽。

典型客户:

某大型央企能源集团、某半导体头部企业、某头部券商机构、某综合性央企集团、某城市级政务综合体

3.2智能办公Agent

市场定义:

智能办公Agent是基于大模型和Agent技术框架,深度集成企业现有的OA、知识管理、业务系统等,旨在模拟或部分代替人类员工完成流程性、事务性、知识型工作,提升企业运营效率和员工办公体验的新一代智能应用。

甲方终端用户:

终端用户是企业的全体员工,但中层干部、知识密集型岗位(如研发、法务、财务、人事等)和高层管理者是该类Agent的核心价值体现者。

甲方核心需求:

企业对智能办公Agent的需求,已经从追求工具效率转向追求生产力提升,核心是让Agent成为“类人”员工,在关键价值链上代替或辅助员工完成工作,从而实现降本增效和知识沉淀。企业对智能办公Agent的期望已超越简单的问答工具,集中在四大核心诉求上:释放员工时间(从事务性工作中解脱)、提升岗位生产力(在专业领域代替或辅助人)、赋能企业知识(通过专业知识构建壁垒)、以及提供一体化体验(统一入口和跨系统集成)。

  • 生产力突破:从”工具”到”类人”,将Agent视为岗位的生产力延伸。甲方最核心的需求是希望Agent能代替或部分代替人。这要求Agent不能只停留在简单的“工具”层面,而是要具备“类人思维”,能够锚定企业核心价值岗位,理解岗位工作流程,释放员工的时间去处理更具创造性和复杂性的任务。例如,在研发或法务等知识型岗位中,Agent应能完成专业的知识检索、内容生成、流程推动等复杂任务,真正成为岗位生产力的有效延伸。
  • 知识结构化与赋能:将企业内部海量知识转化为业务壁垒。对于知识密集型企业,其核心资产是“知识”。企业希望Agent能够深度挖掘和沉淀企业内部的非结构化数据(如文档、聊天记录、历史项目经验等),并将其结构化、专业化,从而形成一套企业专属的“知识库或经验集”。通过Agent的智能问答和知识服务,能够快速赋能新员工、打破部门间的知识孤岛,并形成企业的核心业务壁垒。
  • 跨系统与流程整合:让Agent成为统一入口,实现”多系统合一”的一体化办公体验。企业内部的业务系统(如OA、ERP、CRM、HRM等)通常相互独立,导致员工需要频繁切换应用和跨系统操作。客户迫切需要智能办公Agent能够提供一个统一的对话入口,通过自然语言调用后台的多个系统和工具,完成一个完整的跨系统业务流程,从而大幅简化员工操作,提升工作连续性。
  • 高层决策辅助:提供快速、精确的企业运营态势洞察。智能办公Agent也需服务于高层决策。通过整合企业运营数据和知识,Agent要能快速响应高层对企业运营态势的提问,例如销售进度、项目风险、人员结构分析等,以便高层能迅速获取关键信息、洞察潜在风险,并支持其进行更精细化的管理和决策。

厂商能力要求:

厂商需要具备的不只是大模型技术,更重要的是对企业管理和业务流程的深刻理解,以及将AI能力嵌入到企业核心业务流中的工程化能力。厂商需具备的能力要求聚焦在四大关键点:流程编排能力(将AI融入复杂业务)、知识工程能力(处理和治理企业私域知识)、生态集成能力(兼容企业现有IT资产)、以及实施方法论(保障项目落地效果和推广)。

  • 业务流程的理解与编排:能够将Agent能力嵌入到复杂的企业业务流程中。智能办公Agent不能是独立的“玩具”,必须是企业业务流程的一部分。这要求厂商具备强大的流程编排能力,能够深刻理解企业复杂的、跨系统的审批、报销、项目管理等业务逻辑,并将Agent的能力作为关键环节嵌入其中,实现流程的自动化和智能化推动。
  • 知识工程与治理能力:解决企业私域知识的获取、清洗、更新与权限控制。智能办公Agent的核心竞争力在于其对企业私有知识的利用。厂商需要拥有完善的知识工程能力,能够高效地采集、清洗、抽取、向量化企业海量的多模态数据,并解决知识的时效性更新问题。同时,必须具备企业级的知识权限管理能力,确保员工只能获取其职权范围内的知识。
  • 丰富的IT生态集成经验:兼容并纳管企业已有的遗留系统和IT资产。企业的IT环境是复杂的,存在大量遗留系统。厂商必须具备与主流OA、ERP、CRM、HRM等系统深度集成和纳管的能力。这种集成不仅是简单的API对接,还包括对旧系统的适配以及数据的安全传输,确保Agent能够顺畅地调用和整合不同系统中的信息和服务。
  • 体系化的项目实施方法论:帮助客户找到价值点并推动AI在企业内部的普及。由于Agent是新兴事物,客户往往缺乏落地经验。厂商需提供一套从战略到实施的完整方法论,帮助客户从“找准核心价值岗位”开始,完成“样板点建设”,并通过内部竞赛、培训等方式“加速价值实现和推广”。这套方法论能有效保障项目从PoC到全面推广的成功率。

入选标准说明:

  1. 符合智能办公Agent市场分析的厂商能力要求;
  2. 近一年厂商在该市场至少服务3家企业;
  3. 近一年厂商在该市场的收入规模至少在100万元。

代表厂商评估:

d00f61e253e3857d6090cebd292bf6bb

蓝凌

厂商介绍:

深圳市蓝凌软件股份有限公司成立于2001年,中国领先的数智化办公专家、《知识管理国家标准》参编单位。为各类组织提供LanBots.AI智能体搭建与管理平台、数智空间、智能知识管理平台aiKM、aiOA、aiBPM流程、ai低代码、智能合同等产品方案,成功服务中国邮政、国投证券、招商银行、宁德时代、OPPO、赛力斯、云南白药、中国地质大学等5万家组织。

产品服务介绍:

蓝凌在Agent领域的核心产品为“LanBots.AI智能体搭建与管理平台”,其研发历程从2017年的“框计算”理念演进至当前的3.0智能体阶段。该产品不仅是单一的对话工具,而是由“数智化空间、智能体中台、知识湖仓”构成的“三件套”解决方案。 在架构上,LanBots.AI融合了感知、思考、行动(FlowBots)与记忆系统,深度集成主流大模型(如DeepSeek、通义千问)及OCR等小模型。其核心差异化在于“FlowBots”智能体编排能力,能够结合蓝凌成熟的BPM流程引擎,实现从意图识别到业务操作(如自动填单、审批、风险合规)的闭环。此外,产品强调数据治理,通过知识湖仓为Agent提供高质量的专有数据支撑,解决企业“幻觉”痛点,支持本地化部署以保障数据安全。

5c6abc13a5eed098b075e6339ffc3f76

图:蓝凌LanBots.AI产品三件套

厂商评估:

在当前智能办公Agent市场中,蓝凌展现出了鲜明的“B端实战派”特质。与侧重算法模型的互联网大厂不同,蓝凌的核心竞争力在于对大型企业复杂业务逻辑的深刻理解及“最后一公里”的落地交付能力。蓝凌并未试图在通用大模型底座上进行军备竞赛,而是采取了“CIO视角”的平台化策略,将Agent视为企业级基础设施而非碎片化工具。通过将深耕多年的流程引擎(Action)与知识管理(Memory)能力与大模型技术解耦融合。蓝凌有效解决了Agent在企业侧落地时面临的“行动力不足”与“数据质量差”两大核心阻碍。其“咨询+服务”驱动的交付模式,使其在央国企及大型制造业等高门槛市场中,具备了较高的项目成功率和客户粘性。

  • 坚持“CIO视角”的平台化策略,通过构建统一的智能体中台解决企业应用碎片化与安全管控难题。在企业级市场,尤其是央国企与大型集团中,IT建设的碎片化(“烟囱”效应)是CIO面临的长期痛点。蓝凌在Agent产品的设计上延续了其“中台化”的产品基因,不鼓励部门级或员工级零散地搭建不可控的Agent,而是主张通过统一的基座进行集约化建设。 这种策略的核心价值在于“可控”与“复用”。从CIO的视角来看,分散的智能体工具会导致数据泄露风险激增且难以维护;而蓝凌提供的“数智化空间、智能体中台、知识湖仓”三件套,实际上是为企业构建了一个统一的智能体运行环境。通过这一中台,企业可以统一管理算力资源、统一控制数据权限、统一编排业务流程。这不仅顺应了大型企业(特别是央国企)对合规与安全的刚性要求,也符合国务院相关政策对企业智能体渗透率的宏观指引,使得蓝凌在承接集团级、系统级的大型AI项目时具备天然的架构优势。
  • 以“行动力”为核心差异点,利用成熟的流程引擎将Agent从“对话框”推向“业务流”。当前市场上的Agent产品普遍存在“重思考、轻行动”的现象,即擅长信息检索与生成,但难以直接操作业务系统。蓝凌敏锐地捕捉到了这一痛点,明确提出Agent必须具备“行动能力”才能产生业务价值。 蓝凌的竞争壁垒在于其拥有沉淀多年的BPM(业务流程管理)引擎与低代码能力。在LanBots产品体系中,FlowBots(流程智能体)占据核心地位,它能够调用企业原有的工作流接口,实现自动填单、自动审批、跨系统调用等复杂操作。例如,在合同管理或财务报销场景中,Agent不仅能回答政策问题,还能直接提取单据信息并发起审批流程。这种将NLP技术与工作流引擎深度绑定的能力,使得蓝凌的Agent能够真正替代部分人工岗位(如初级审核员、客服),而非仅仅充当辅助咨询的助手,从而在销售、客服、研发等对“人效”敏感的部门实现了可量化的商业价值。
  • 依托知识管理(KM)传统优势,以高质量的数据治理能力构筑Agent的“记忆系统”。数据质量是决定企业级Agent成败的关键因素。与单纯的技术厂商相比,蓝凌作为《知识管理国家标准》参编单位,在非结构化数据处理领域拥有深厚的积累。 蓝凌认为,单纯依靠大模型的推理能力无法解决企业特有的业务问题,必须依靠高质量的“知识实体”与“本体论”来增强模型的表现。因此,蓝凌的方案极其强调“知识湖仓”的建设,在项目实施中引入类似Palantir的FDE(前置部署工程师)模式,帮助客户进行数据清洗、知识结构化与治理。这种“治理先行”的理念,使得蓝凌的Agent在处理制度问答、情报分析等依赖高准确度的场景时,能够显著减少模型幻觉,提供更精准的RAG(检索增强生成)体验。
  • 采用“超级个体”方法论与高强度的驻场服务,确保复杂场景下的项目交付成功率。在Agent落地过程中,技术往往只占成功的20%,剩下的80%取决于场景选择与工程化服务。蓝凌坦诚地承认大厂模型能力的同质化,因此将竞争重心转向了“服务能力”与“落地方法论”。 针对企业高层预期过高但落地无从下手的挑战,蓝凌提出了一套务实的“超级个体”实施方法论:不盲目追求全员覆盖,而是锚定企业内的高价值岗位(如金牌销售、资深研发),通过Agent将其能力标准化并复制给普通员工。同时,蓝凌摒弃了SaaS化的轻交付模式,愿意投入高成本的实施顾问深入客户现场,与业务部门共同梳理场景。这种“重服务”的模式虽然牺牲了部分利润率,但极大地提升了项目的存活率与客户满意度。特别是在许多企业对AI项目持观望态度或经历过失败尝试的背景下,蓝凌这种做深做透的能力,成为其在B端市场建立口碑的关键。

典型客户:

赛力斯、中科星图、某央企世界500强、某500强集团型企业

3.3 营销Agent

市场定义:

营销Agent是指基于语言模型、多模态模型、专家模型等构建的智能体系统,专注于营销全链路的智能决策与执行自动化。营销Agent覆盖用户洞察、内容生成、广告投放、客户互动、数据分析等场景,旨在提升营销效率、降低人工成本并优化商业回报。

甲方终端用户:

企业营销部门、销售部门、客户服务部门、数据分析团队等。

甲方核心需求:

以下为企业对于营销Agent的核心需求:

  • 提升营销决策效率与准确率。在当前的数字营销环境中,企业面临的核心挑战之一是如何在海量数据和全渠道交互中快速做出高精准度的决策。

传统的营销流程依赖人工分析、分段执行和滞后反馈,导致决策周期长、响应速度慢,且容易因主观判断或数据碎片化而影响决策准确度。甲方企业迫切需要通过技术手段实现营销决策的智能化,从而在激烈的市场竞争中抢占先机。

企业对于营销决策的强烈诉求,源于数据价值未被充分挖掘。许多企业虽已部署CDP、MA等系统,但这些系统往往无法支撑实时决策。例如,广告投放策略通常基于历史数据预设,无法根据实时用户行为动态调整。

同时,营销场景的复杂性和多变性进一步放大了对决策效率的需求。例如,在促销活动期间,企业需快速响应流量峰值、突发舆情或竞品动作,但人工团队难以在秒级时间内完成人群重定向、内容调整和渠道分配。

因此,企业需要营销Agent能够替代人工完成决策任务,如实时人群圈选、个性化内容生成和跨渠道触达策略优化等。

  • 覆盖多营销场景,以及支持多模态。企业为应对碎片化流量和个性化消费,迫切需要一种能够覆盖全链路营销场景,并支持多模态交互的智能体解决方案。

企业希望打破场景与模态之间的隔阂,实现跨渠道、多形态的连贯体验,从而最大化用户engagement与转化效率。

具体而言,甲方需要营销Agent支持营销全流程,以及人群圈选、策略设定、广告投放、客服咨询、社媒评论等全场景。若Agent仅支持单一场景,则企业仍需人工协调多平台,导致效率损失和数据断裂。

多模态支持的需求,尤其凸显在内容生成与用户洞察场景。甲方企业需通过Agent同时处理文本(如用户评论)、图像(如产品图片)、语音(如客服录音)等输入,并输出跨模态的响应。

此外,场景与模态的复杂性要求营销Agent具备上下文连贯性。例如,用户可能在抖音看到视频广告,随后到私域客服中文字咨询,企业需确保Agent在不同场景和模态间识别同一用户意图并提供一致性回应。

  • 无缝集成现有业务系统。甲方企业已投入大量资源构建了CDP、MA、CRM等核心业务系统,这些系统承载着关键业务流程和数据资产。然而,营销Agent若不能与现有系统深度集成,将导致数据孤岛加剧、业务流程断裂,反而增加运营复杂度。

首先,营销Agent必须充分利用起企业一方数据。用户行为轨迹、交易记录、标签画像等企业一方数据,大多沉淀在CDP与CRM中,若营销Agent无法直接调用这些数据,其决策将基于片面或脱节信息,导致输出结果偏离实际业务。

同时,业务流程的连贯性依赖系统间无缝协同,也需要营销Agent与现有业务系统深度集成。企业的营销活动通常涉及多系统协作:从CDP人群圈选到MA内容触达,再到CRM销售跟进。若Agent无法嵌入既有流程,将迫使人工在不同平台间切换搬运数据,造成效率瓶颈与误差风险。

此外,集成需求还涉及成本与风险控制。企业担忧新系统引入带来的实施成本、培训负担及安全风险。若Agent需要大量定制化开发才能对接现有系统,将显著提高部署门槛。

厂商能力要求:

以下是对于营销Agent的能力要求:

  • 要求营销Agent可以实现动态实时决策。为满足企业对营销决策效率与精准度要求,厂商必须提供实现动态实时决策。这意味着营销Agent需具备即时数据处理和闭环反馈优化的能力。

动态实时决策的核心在于将数据输入、分析计算和行动执行压缩到极短的时间窗口内,从而应对营销场景的瞬时变化。该能力是衡量营销Agent技术成熟度的关键指标,直接决定其能否在真实业务环境中创造价值。

此外,实时决策需配备持续进化机制。厂商应设计闭环反馈系统,使Agent能够从每次决策结果中学习优化。例如,通过用户行为反馈自动修正模型参数或规则库。

  • 覆盖营销链路上多个营销场景,并且支持文本、语音、图像等多模态输入输出。这一能力要求厂商不仅具备多模态算法技术,还需对营销业务流有深度理解,以确保各场景与模态的协同高效。

厂商需首先实现多场景闭环整合。营销Agent应嵌入企业现有业务系统,在不同场景间共享数据与决策逻辑。例如,当Agent在客服场景中通过语音交互识别用户投诉,应能即时触发营销场景的优惠券生成与投放,同时更新用户标签用于后续人群圈选。

多模态支持,要求厂商构建统一的多模态处理引擎。该引擎需具备三层次能力:多模态输入解析、跨模态信息融合和多模态输出生成。

此外,厂商需解决多模态场景下的合规与一致性问题。例如,生成的图片需符合品牌视觉规范,语音内容需避免敏感词,且多模态输出需在不同场景持信息一致。

  • 与CDP、MA、CRM等系统无缝协同,避免数据孤岛和流程断裂。这要求营销Agent具备开放的API架构、预置连接器、实时数据同步机制及统一身份识别能力,确保在不改造现有系统的前提下,实现数据流与业务流的双向贯通。

首先,厂商需提供标准化集成方案,降低对接复杂度。这包括提供丰富的预置连接器,以及支持标准协议的数据交换接口。

其次,业务流程层面的嵌入式集成也很关键。厂商应支持将Agent能力以原生组件形式嵌入现有业务界面,如CRM中的智能助手插件或CDP中的预测分析模块,而非强迫用户切换独立平台。

入选标准说明:

  1. 符合营销Agent市场分析的厂商能力要求;
  2. 近一年厂商在该市场至少服务3家企业;
  3. 近一年厂商在该市场的收入规模至少在100万元。

 

代表厂商评估:

fad05483680c69e4a36160105c87204b

深演智能

厂商介绍:

深演智能是中国领先的决策AI技术公司,提供以营销及销售场景为战略重点的决策AI应用,涵盖用户数据运营、营销与投放以及AI智能体平台等产品。深演智能成立于2009年,已服务全球超 800 家企业,覆盖零售、美妆、汽车、跨境电商等领域。

产品服务介绍:

Deep Agent是深演智能旗下的 AI 智能体平台,平台基于公有大模型底座,围绕智能用户运营、智能广告投放、智能销售助理,智能客户服务、智能创意生成、产品推荐等各类核心业务场景,快速提升决策的精准度、速度和适用性,助力各行业 AI 落地核心场景。

厂商评估:

深演智能Agent产品体系,深度嵌入企业的业务流程,并构建了决策闭环。其核心在于将嵌入业务流、消除模型幻觉、自我进化、商业模式先进,以及业务垂直易用等优势,有机整合为差异化竞争壁垒。

  • Agent产品无缝嵌入业务流,覆盖企业营销与销售决策全场景。深演智能Agent产品可以嵌入既有的CDP、MA系统,不仅无缝集成到工作流中,同时充分放大了企业一方数据价值。而且,深演智能Agent产品矩阵丰富,覆盖了营销域、销售域核心决策场景。

深演智能Agent产品核心竞争力在于其与CDP、MA等既有营销产品的无缝协同。由此,Agent平台可以充分利用企业一方数据价值,实现动态实时决策。例如,当企业MA系统执行用户触达任务时,Agent可即时调用CDP中的客户行为数据,结合广告投放系统的实时反馈,动态优化人群圈选策略和内容生成逻辑。这种端到端的整合,不仅避免了传统AI工具只输出不落地的问题,还将企业一方数据的利用率提升至新高度。

同时,嵌入业务流的产品设计大幅降低了企业使用门槛。业务人员无需切换多个平台,即可通过自然语言调用Agent功能。例如,在销售场景中,Agent企微助手直接集成至企业微信工作流,自动处理客户咨询,大幅缩短销售响应时间。

710f55fab63001376f57b72d78b206da

深演智能升级Agent产品之后,已经形成超过10个垂直智能体的协同矩阵,覆盖了营销与销售域的核心决策场景,形成从决策到执行的完整闭环。在营销域,平台提供智能用户运营、广告投流优化、社交媒体策略生成等功能。在销售域,平台则深入客服助手、销售话术质检等场景。这种Agent协同矩阵,使企业真正实现了用户全生命周期管理的目标。

8fe4199ee43b49f896829a7ef407cdc3

  • 大小模型融合,确保决策精准与零幻觉。深演智能采用大模型+小模型的融合架构,既能够解决大模型在营销决策中的不确定性问题,又能通过大模型调度小模型处理复杂决策。

大小模型在分工层面,职责明确。大模型负责意图识别和自然语言交互,小模型处理确定性决策,确保企业所需的高准确度和零幻觉。例如,在销售助手中,大模型解析用户意图后,调用小模型生成个性化话术,避免虚构内容。这种大小模型融合的架构,避免了模型幻觉导致的内容准确性问题。

同时,大小模型融合之后可以协同工作,大模型作为总指挥调度小模型,处理复杂任务。其核心价值体现在任务的动态编排以及多模态层面。

在任务动态编排层面,大模型通过实时解析用户需求,将其拆解为人群圈选、内容生成、优惠策略等子任务,依次调用对应小模型执行。例如,大模型可以先识别客户咨询意图,再调用话术小模型生成回复,执行端到端决策。

在多模态层面,大模型整合语音、文本等异构数据输入,为小模型提供丰富的输入。在坐席助手场景中,大模型解析客服通话的实时语音,捕捉客户需求,同步联动产品推荐等小模型进行个性化回应。

  • 大模型构建Agent自我进化机制。在确立了大小模型协同的基础架构后,深演智能进一步利用大模型构建了Agent的自我进化机制。这也是借鉴了深演智能在小模型效果优化方面的经验积累。通过反馈闭环与知识更新,大模型构建的Agent能够基于业务实践持续优化决策逻辑。例如,品牌的VOC客户洞察Agent在上线之后,可以持续学习新增的差评样本,以提升识别准确率和回复有效性。Agent持续自主进化,显著提升了AI决策系统的场景泛化能力。
  • 在商业模式设计中,深演智能通过灵活的定价与效果导向机制,显著降低企业采购Agent的决策成本。一方面,深演智能产品既可以嵌入现有系统叠加销售,也可以在部分场景独立售卖,定价机制灵活。另一方面,Agent商业化以先降本再优化效果的策略,构建易于客户决策的商业模式。

针对已采购CDP、MA等系统的客户,深演智能提供Agent功能包叠加授权模式,客户仅需支付少量增量费用即可激活Agent能力。对于没有业务系统支撑的决策场景,深演智能为客户提供独立采购的付费模式。这种灵活的定价机制,不仅降低了客户初次尝试的门槛,还通过模块化组合满足企业多方面需求。

而且,深演智能商业化遵循从降本→效果优化的路径。优先通过可量化的降本数据建立客户信任,再过渡至转化率、GMV等效果指标的价值验证。

在落地的初步阶段,Agent聚焦替代重复性人工任务,提供显性降本数据。例如,VOC Agent通过自动化处理客服语音与社媒评论,将人工处理量从10人缩减至1人,效率大幅提升。在降本基础上,深演智能再将Agent扩大应用范畴,实现效果优化的价值。这种分阶段的价值释放,使企业决策者能够清晰量化ROI,大幅降低采购阻力。

目前,深演智能Agent平台已在汽车、零售、金融、快消等行业验证了其提升决策效率与商业回报的能力。

  • 业务专家深度赋能,降低使用门槛。深演智能强调Agent专业服务与业务场景的深度结合,通过专家知识和系统集成,确保Agent易用且可落地。dc7ccce97e95463dc5affd34a9dc1c84

基于深演智能在营销、销售领域积累的行业Know-How,这些专家知识被转化为决策规则与场景解决方案模板,直接集成至Agent产品中。同时,Agent产品已经嵌入企业的业务系统,使得专家知识、业务系统和企业一方数据均可以为精准决策贡献价值。

同时,Agent产品通过自然语言交互和可视化设计,使业务人员无需理解技术细节即可操作复杂功能。例如,智能群组Agent可以自动调用算法模型,完成人群圈选工作。使得业务团队降低了对于技术团队的依赖,并且可以灵活调整模型使用特征。

除了服务国内客户,深演智能也已经开启了出海战略。通过将中国市场的复杂业务场景经验转化为全球化解决方案,期望与国际厂商展开差异化竞争。深演智能CEO黄晓南表示,“目前国内Agent产品在前端的互动已经非常出色。这是我们实现超越国外头部厂商的机会。”

典型客户:

长安汽车、方太、雀巢、三得利

 

44f14ac530a78d005d2b90181a3211c7

天娱数科

厂商介绍:

公司成立于2010年,并于2014年上市。天娱数科(股票代码:002354),人工智能跋涉者,公司以数字化、智能化、全球化为战略,将“数据要素×”与“人工智能+”结合,依托海量数据要素资源优势和人工智能算法技术优势,开发多个企业级大模型,构筑了AI营销SaaS、移动应用分发PaaS、空间智能MaaS三大业务平台,为数字化转型、智能化升级和全球化发展持续赋能。

产品服务介绍:

构建“1+X”智能体矩阵,通过内容生成、数据洞察、智能投放、智能客服、策略分析等模块化智能体,实现营销全链路自动化,破解“流量成本高、投放效率低、用户运营难”行业痛点。

厂商评估:

天娱数科的营销智能体矩阵已在互联网、金融、跨境保健品、美妆护肤、3C等领域实现落地应用。

在保险行业,为平安保险等头部客户构建精准用户画像,优化营销策略,显著提升产品推广效能;在跨境保健品领域,助力PERDAYS、迪巧等品牌销售额破亿,通过AI智能体深度分析海外市场需求,实现营销内容与渠道的精准匹配;在美妆行业,A-9 Code品牌借助AI内容生成与智能投放策略,荣登抖音销售排行榜前列,品牌曝光与销量双增长。

凭借内容生产智能化、营销流程自动化、合规风控体系等三大优势,天娱数科在营销Agent市场构建了差异化竞争壁垒。

7d0e42892338909cc82191432bc31678

第一个优势体现在内容生产智能化方面,其素材采集Agent能够自动识别优质资源,图像优化Agent可完成一键美化,脚本策划Agent则基于热词生成创意草案,这些功能共同使得视频制作效率大幅提升。

第二个优势体现在营销流程自动化方面,通过客户响应Agent实现私信评论秒级回复,语音摘要Agent将旧线索通话文本转化为结构化标签,从而显著提升了运营人效。

第三个优势体现在完善的合规风控体系,内容审查Agent可实时检测生成内容,元信息标记Agent能够自动溯源AI生成内容,以此确保全链路的合规安全。

未来,天娱数科的营销智能体矩阵还将从三个方面持续完善。首先,推动其能力从单纯的”生成”向”决策+执行闭环”演进,实现内容生成、多渠道发布、反馈分析及调整优化的全流程一体化。其次,将着力构建”多模态+自动化”的内容管线。Agent接入视觉、听觉等多种模态,同时提升自动化程度,并增强对长尾营销场景的覆盖能力。此外,天娱数科还将打通私域与电商链路。使Agent不仅能完成内容推送,还可实现与客户对话、下单、催付及售后等环节的闭环服务,打通与CRM及电商后端系统的技术壁垒。

86476c44af0d38e2f8cf7a79a169a826

典型客户:

重庆纵越国际旅行社有限公司、成都自在行旅游有限公司、海外国际旅游集团上海好好旅行社服务有限公司、湖北岫悦文化旅游有限公司、湖南爱玩客旅游管理有限公司

 

3.4 陪伴式智能硬件

市场定义:

陪伴式智能硬件是结合了具身化形态、大模型能力以及多模态感知技术的智能设备,旨在提供个性化、情感化、可持续进化的交互体验,满足用户在情感、教育、健康等方面的陪伴需求。

甲方终端用户:

核心终端用户包括儿童、老年人(银发族)以及追求精神情感价值或垂直功能的年轻潮玩爱好者。

甲方核心需求:

客户对陪伴式智能硬件的核心需求已从简单的功能性交互,升级为对情感连接、深度个性化、垂直场景专业性和持续进化性的追求,强调其作为家庭成员或专属助手的角色。终端用户对陪伴式智能硬件的需求集中在四个方面:追求拟人化的情感连接,渴望其成为家庭伙伴;要求其在垂直场景(如教育、养老)具备专业服务能力;要求交互体验必须做到自然、流畅且高情商;同时高度关注数据安全与伦理合规。

  • 情感连接升级:从”智能工具”到”真正的伙伴或家庭成员”。用户不再满足于设备只是简单的语音助手或工具,而是要求硬件具备拟人化的情感表达能力、长期记忆和个性化成长的能力,能够建立与用户之间可持续的、有温度的情感连接,像家庭成员或真正的伙伴一样,以填补现代生活中的情感空缺。
  • 垂直场景专业化:提供定制化的教育、健康或照护服务。针对儿童教育、居家养老等垂直场景,用户需要Agent具备专业领域的知识和能力,例如在教育场景中提供学业辅导和习惯引导,在养老场景中实现用药提醒和健康监测等,以满足专业化、功能性的需求,而非泛泛的通用聊天,从而体现产品的核心价值和溢价能力。
  • 自然流畅的交互:实现多模态、低延迟和高情商的对话。用户对交互的体验要求极高,要求Agent不仅能听、能看、能说,还要做到低延迟、不突兀的打断机制(优雅的对话掌控),以及上下文理解和情绪感知,使得人机交互无限接近于人与人之间的高情商自然交流。这是决定用户是否持续使用的关键要素。
  • 数据安全与隐私保护:特别针对儿童和老年用户的伦理考量。鉴于硬件收集用户的语音、习惯、甚至健康数据,且主要服务于敏感群体(儿童、老年人),数据安全、隐私保护和伦理合规成为甲方的核心诉求。要求厂商在数据采集、存储和使用上遵循最高的标准,确保设备不会被用于不良信息传播或数据泄露。

厂商能力要求:

厂商的核心能力要求集中在具身化AI的工程实现、垂直场景的知识和内容构建、全栈硬件与软件的整合,以及解决大模型在硬件上运行的性能和成本难题。厂商需具备的能力要求聚焦在四大关键点:具备全栈式AI工程能力,将大模型高效地部署在边缘硬件;掌握高阶多模态感知技术,实现高情商交互;拥有垂直内容与知识构建能力,提供持续更新的专业服务;以及实现软硬件一体化设计,将AI”灵魂”具象化。

  • 全栈式AI工程能力:将大模型高效地压缩和部署到边缘硬件。厂商需要具备从云端到边缘的完整技术栈。这包括对大模型进行轻量化、微调,并将其高效地部署到低功耗、低成本的智能硬件芯片上,解决计算资源受限下的性能、延迟和功耗问题,实现离线或准离线的快速响应,以保证用户体验。
  • 高阶多模态感知:实现高情商、非粗暴式的自然交互。厂商必须掌握先进的多模态融合技术,不仅是语音识别,还包括情绪识别、意图预判、视觉追踪等。关键能力是实现“优雅的对话掌控”,例如能预判用户打断意图并“渐出”退场,而不是粗暴地打断用户,这是实现“伙伴感”和提升用户粘性的关键技术飞跃。
  • 垂直内容与知识构建:提供高价值、定制化的内容和服务生态。为了服务垂直场景,厂商需要有能力构建特定领域的知识库和内容生态(如儿童早教课程、健康知识库)。这种内容必须是持续更新、专业可靠的,能够通过Agent框架不断学习和迭代,以保持产品在垂直市场的竞争力。
  • 软硬件一体化设计:实现硬件形态与AI”灵魂”的完美匹配。硬件的工业设计和结构工程至关重要。厂商需具备将AI能力与硬件形态、传感器、执行器(如肢体运动)高度整合的能力。优秀的设计能够赋予AI“具身化”的形态和“灵魂”(如表情、动作),帮助用户感知AI的“隐形价值”,从而突破产品同质化。

入选标准说明:

  1. 符合陪伴式智能硬件市场分析的厂商能力要求;
  2. 近一年厂商在该市场至少服务1家企业;
  3. 进一年厂商在该市场的收入规模至少在50万元。

 

代表厂商评估:

1e33f89242b0b59da3fa13bae570f0d0

网易云信

厂商介绍:

网易云信,集网易 29 年技术打造的智能融合通信领军者,提供包含 IM 即时通讯、视频云、对话式智能体、短信及云原生等智能融合通信产品及行业解决方案。

目前,智能融合通信已接入 235 万企业开发者,全球注册应用数超100 万,累计覆盖智能终端 SDK 数超 300 亿,月均智能对话10亿+,月均消息量3400+ 亿条居行业首位。

在陪伴式智能硬件领域,网易云信定位为“一站式对话式智能体解决方案提供商”,致力于通过“通信+AI”的融合技术,为传统硬件制造商及垂直场景服务商提供从底层连接到上层大模型交互的全链路能力,推动硬件产品的智能化转型。

产品服务介绍:

网易云信的“情感陪伴式智能硬件解决方案”及“智能硬件 AI 对话平台”,围绕智能硬件实时对话与反馈需求,不仅提供基础的 SDK 与 API 接口,更构建了一套完整的“RTC 对话式 AI Pipeline”。

该方案核心在于将实时音视频(RTC)技术转化为 AI 的“神经系统”,连接终端硬件与云端的情感大模型,产品功能覆盖了从前端的音视频采集处理(AI降噪、回声消除、声音克隆)、触感反馈,中间的传输与逻辑编排,到后端的内容理解与语音合成。

针对陪伴场景,平台特别强化了“拟人化”能力,包括支持全双工的“智能打断”、基于声纹的“角色锁定”、多模态情绪识别、自研的故事引擎以及具备长中短期记忆的“动态人设”构建。

在兼容性方面,产品深度适配乐鑫、瑞芯微等主流低功耗芯片,并支持与各类国内外主流大模型灵活对接,满足儿童玩具、养老看护及 Z 世代情感陪伴等多场景需求。

厂商评估:

网易云信在陪伴式智能硬件市场的核心竞争力,在于其成功将传统通信技术(RTC/IM)的工程化优势平移至 AI 交互领域,解决了大模型落地硬件时面临的“响应延迟”、“不稳定性”、“互动缺乏连贯性”难题。与纯算法公司不同,网易云信并不单纯依赖模型能力的输出,而是通过构建“端云协同”的 AI 管道,在极低成本的硬件上实现了电信级的连接稳定性与拟人化的交互节奏。其评估重点在于:利用通信技术底座解决 AI 交互的实时性与抗噪难题;通过极致的软硬适配降低传统制造业的智能化门槛;以及通过动态记忆与情感模型解决陪伴类产品“用户粘性低”的行业通病。

  • 以通信工程底座重构 AI 交互链路,解决大模型落地硬件的“最后一公里”延迟与稳定挑战。大模型技术虽然赋予了硬件“大脑”,但从用户说话到机器响应的传输链路往往成为体验的瓶颈。网易云信的差异化优势在于其没有将 AI 对话简单视为“API 调用”,而是将其视为“实时通信流”进行管理。基于其 WE-CAN 全球传输网络,云信将端到端延迟压缩至 650ms 以内,并能在 80% 丢包率的弱网环境下保持对话连贯。这种电信级的工程能力,使得其方案在面对农村养老(网络差)或跨境出海(跨国传输)等复杂网络环境时,具有显著的鲁棒性优势。此外,针对 AI 硬件普遍面临的“断网即变砖”的稳定性焦虑,网易云信采用了“云端 + 本地”结合的技术架构。通过在端侧预置轻量化模型或规则,确保设备在网络波动或断连时,仍能执行紧急报警、基础提醒等核心功能。这种从通信层面对数据流进行全链路优化的能力,不仅保证了交互的实时性,更为陪伴式硬件在安全看护等严肃场景下的落地提供了必要的高可用性保障。
  • 通过“智能打断”与“声纹锁定”技术,修正 AI 交互的机械感,确立拟人化对话的体验标准。在陪伴式场景中,交互的自然度直接决定了用户的情感投入度。目前市场上大量低端 AI 玩具存在“无法插话”或“容易被环境音误触发”的问题。网易云信通过自研的“云端AEC(回声消除)+ AI VAD(语音活动检测)+ AI 智能轮次检测”方案,实现了真正意义上的全双工交互。该技术不仅能让用户随时打断 AI 的播报,更重要的是通过语义预测模型,智能区分用户的“思考停顿”与“说话结束”,将意外中断率降低了 85%。这种对节奏的精准把控,使得人机对话不再是回合制的指令交换,而更接近真人之间的即时交流。同时,针对家庭、商场等开放环境下的噪声干扰,云信引入了 AI 声纹锁定技术。该技术允许硬件“认出”特定用户(如只响应主人的声音),并自动屏蔽背景中的电视声或他人交谈声。在养老和儿童场景中,这一能力还被进一步延伸为“分级应答”机制,即设备能根据识别到的说话人身份(老人或孩子),自动切换不同的语态和内容策略,从而在物理层面保证了陪伴的私密性与内容的适龄性。
  • 打破硬件成本与 AI 算力的悖论,以极高的兼容性助力传统低毛利制造业实现智能化转型。陪伴式智能硬件的主要供给方——如东莞、澄海的玩具厂商,对成本极度敏感,往往难以承担高性能芯片的高昂 BOM 成本。网易云信的战略价值在于其极强的“向下兼容”能力。通过对底层 SDK 的深度剪裁与优化,云信成功将整套 AI 交互引擎适配到了乐鑫、博通、全志、思澈等价格仅为十几元甚至更低的低功耗 MCU 芯片上。这一工程突破对于行业的意义在于,它允许传统玩具厂商在不大幅改变原有供应链和产线的情况下,仅通过更换或升级廉价模组即可接入先进的大模型能力。这种“轻量化硬件 + 云端重算力”的模式,不仅大幅降低了 AI 硬件的准入门槛,支持了弹性部署和按需付费,还帮助厂商有效规避了因重资产投入研发而带来的经营风险,是推动陪伴式 AI 硬件从“极客尝鲜”走向“大众消费”的关键推手。
  • 构建具备“动态演进”能力的 AI 灵魂,以长时记忆与情感反馈解决用户“三分钟热度”的留存痛点。传统智能硬件的高退货率和低留存率,往往源于其交互内容的静态与匮乏。网易云信在评估中展现了对“情感粘性”的深刻理解,其解决方案不仅关注“能听懂”,更关注“记得住”和“有感情”。通过引入向量数据库与多层次记忆管理架构,云信赋予了智能体‘长时记忆’能力,使其能够记录用户的喜好、习惯及过往对话细节,并在后续交互中主动引用。在此基础上,云信引入了动态的“亲密度”与“养成”机制。AI 的回应风格不再是一成不变的,而是随着交互频率和记忆深度的增加,从礼貌疏离逐渐演变为熟络亲密,甚至会根据关系阶段主动发起话题、表情与物理触摸反馈等情绪表达。这种具备成长性的“动态灵魂”设计,配合自主研发的“故事引擎” 、“MCP模块”和“智能硬件开发套件”,让智能体能自我学习新知识,并结合“长期记忆”实现主动分享,成功将用户与设备的单向指令关系转化为双向的情感维护关系,同时支持客户(用户)自定义创建性格和风格各异的角色,从根本上延长了产品的生命周期,为硬件厂商通过内容订阅实现后续商业变现奠定了基础。
  • 整合全链路合规与运营商资源,为垂直场景的商业化闭环提供完备的基础设施保障。在教育与养老等垂直领域,单纯的对话功能难以构成完整的商业闭环。网易云信在单纯的技术供给之外,展现了较强的生态整合能力。特别是在养老场景中,云信打通了运营商网关,使得智能硬件不仅能进行 AI 对话,还能在紧急情况下直接发起真实的电话呼叫(PSTN),连接子女或看护机构。这种“AI + 传统通信”的融合,解决了老人不会使用智能手机的痛点,使硬件真正具备了安防与看护的实用价值。同时,针对日益严趋的全球数据隐私法规(如 GDPR)及国内对未成年人内容的监管要求,云信提供了内置的内容安全过滤与合规架构。对于缺乏技术与法务团队的中小硬件厂商而言,这种“合规即服务”的能力不仅降低了出海与运营的法律风险,也为建立家长与监护人的信任背书提供了必要条件。

典型客户:

网易有道、天津钛极智能、深圳威步、千悟智能、发掘科技

 

3.5 数字人Agent

市场定义:

厂商通过数字人Agent,实现企业在直播电商、培训教育、客户服务等多场景中人力角色的替代与增强。数字人Agent不光能替代主播、讲师、客服等真人角色,并在脚本创作、流程调度等环节增强决策能力。

甲方终端用户:

企业电商运营部门、人力资源部门、客户服务部门等。

甲方核心需求:

数字人已成为企业触达客户、服务客户的重要方式。但数字人落地过程中,企业面临效率、合规等诸多瓶颈。以下为企业对于数字人Agent的核心需求:

  • 突破人力效能天花板。以直播电商主播为例,企业面临主播人力成本高、主播培养周期长等难题。

主播整体人力成本高企,成为企业直播电商的增长掣肘​。首先,直播电商生态对于头部主播依赖度高。超头部主播拥有个人IP,凭借个人影响力垄断核心流量入口。根据行业数据,TOP 10主播占据全平台60%以上GMV,导致企业没有议价权,主播成本持续高企。其次,真人主播单日有效直播时长不足4小时,无法覆盖不同地域的流量窗口。比如,某家电品牌为拓展欧洲市场,由于时差、语言等问题,必须培养新的主播,无法复用国内成熟主播。

同时,主播的能力标准化程度低,也制约了企业直播电商发展。主播培养周期长达半年以上,直接推高人力成本,成为规模化扩张的核心阻力。而且,单一主播难以同时服务多品类,多品类商家需重复配置主播团队,边际成本无法降低。

  • 提高业务全链路运营效率。直播、培训、客服等业务流程中,涉及的岗位角色较多,全链条配合要求高,单一环节运营效率低下都会导致结果不佳。

比如,直播需要主播与助播配合,培训需要讲师与助教配合,客服需要服务人员与工程师配合。多岗位角色需要实时配合,但职能割裂显著拖累整体效率。

  • 合规与信任体系构建。企业尤为关注数字人相关的内容安全与合规审查。

AI技术滥用导致虚假内容泛滥,成为核心合规痛点。一方面,监管部门如国家网信办依据《生成式人工智能服务管理暂行办法》,强制要求AI生成内容需显性标识,但企业执行中漏洞频出。另一方面,更深层风险在于内容幻觉,大模型可能生成夸大或错误的描述。这种真实性缺失不仅招致监管处罚,更削弱用户信任,导致品牌声誉坍塌。

厂商能力要求:

数字人Agent解决方案,要求厂商构建拟真交互、智能体协同与合规可控三位一体的能力体系。

以下是对于数字人Agent的能力要求:

  • 要求数字人的声音、形象与动作极致拟真。厂商需突破声形行一体化调度技术瓶颈,达到拟真体验。基础场景中,口播需要同步生成对应表情及手势;进阶场景中,双数字人需要实现自然交替对话,需解决声源定位与视线聚焦问题;复杂场景中,基于评论区内容,数字人需要自动切换表情并配合手部动作。

同时,单独声音层面,需要厂商能够实现情绪化的真人气息与顿挫,并基于用户行为触发差异化解说。形象层面,要求厂商实现唇形驱动精准匹配任意语速脚本,支持头部转向及手持商品细节展示。

  • 要求厂商构建专业化的智能体矩阵,完整覆盖全业务链条的多岗位职能。除了单智能体的工作执行外,厂商还需要构建多智能体协作机制。各智能体基于统一决策中枢指令协作。典型场景如直播遇到用户询价时,互动智能体负责解析问题、场控智能体定位商品、助播智能体推送优惠话术。

除了智能体建设,厂商还需要建立数据闭环,持续迭代智能体的运营协作策略。通过整合用户行为、用户画像等多维数据源,持续产生新的运营策略。

  • 厂商需构建内容生成的全流程可控方案,解决信息合规与监管标识核心痛点。内容信息层面,过RAG增强知识库约束大模型输出,确保敏感领域0误差描述;监管标识层面,在数字人视频中自动叠加AI生成等水印。

入选标准说明:

  1. 符合数字人Agent市场分析的厂商能力要求;
  2. 近一年厂商在该市场至少服务1家企业;
  3. 近一年厂商在该市场的收入规模至少在50万元。

代表厂商评估:

31f1bf8c611c26188fa86cdddb1be427

百度慧播星

厂商介绍:

慧播星为百度旗下产品,于2023年推出,是全球领先的全场景数字人平台。依托百度强大AI技术,该产品在电商直播领域成果显著,以罗永浩数字人直播间为标杆,实现带货GMV突破5500万元佳绩。慧播星服务王老吉、蒙牛、苏宁等诸多品牌客户。

产品服务介绍:

慧播星新一代高说服力数字人,是多模协同且具备了思考、决策和执行能力的多智能体系统。

它不仅支持数字人形象生成、智能剧本创作、实时互动问答等核心功能,同时具备热点追踪、情感交互等高情商特质,更能调度多智能体协同完成特定任务,让商家以更低成本创作直播和短视频,提升经营效能。慧播星已在多业务场景中表现超越真人,广泛应用于电商交易、线索拓展、内容直播、视频创作等多个领域。

百度慧播星是全球领先的全场景数字人平台,在IDC权威报告中综合实力排名行业第一,更被沙利文评为最具全球发展潜力的中国AI Agent。慧播星还荣膺“世界互联网大会领先科技奖”,成功入选“2025年度中国互联网企业创新发展十大典型案例”,技术实力与市场前景获多重权威认证。

厂商评估:

慧播星凭借技术、产品、商业三维创新,已成为数字人领域的标杆解决方案。技术方面,慧播星以多模态融合、多智能体协作和多模型驱动为核心;产品方面,慧播星以全栈直播能力与合规体系驱动;商业方面,慧播星的普惠模式同时惠及头部品牌与中长尾商家。

慧播星新发布新一代数字人技术,未来将聚焦超拟真人机交互、全球化多语种赋能以及视频与直播生态融合三大方向,继续强化全栈解决方案能力构建。

  • 多模态高度融合,实现直播数字人语调、表情、动作完美匹配,促进直播转化。慧播星多模态高度融合的技术核心,在于打通语音、图像与语义的协同闭环。

语调层面,依托百度自研的直播场景专用TTS技术,数字人能基于脚本语义自动调整语速、重音与情感起伏,使带货语音更具感染力。例如在讲解产品时,数字人会模拟真人鉴赏时的停顿与赞叹语气,刺激用户下单冲动。​

表情与动作层面,慧播星突破行业技术瓶颈,实现语义驱动的动作生成,在手持商品、坐姿站姿等场景下均可生成合适的表情与动作。这种拟真交互大幅降低用户对数字人的隔阂感。实测显示,通过慧播星数字人商家直播间转化率提高31%,印证了多模态融合对商业转化的直接驱动力。

  • 运营、互动、场控、助播等多智能体协作,提升直播场观效果、显著拉升GMV。慧播星通过多个智能体的调度协作,构建了具备自主决策能力的直播超级智能体。

运营智能体动态调度PPT、外景、近景等素材,根据脚本自动切换场景画面,使观看时长提升70%。互动智能体接管100%用户问答,并针对不同用户提问差异化解读商品。场控智能体实时监控用户行为与库存数据,智能调整排品顺序与促销时机;当用户集中询问某商品时,数字人自动优先讲解并开价。助播智能体在关键节点营造氛围,如点赞破万时自动触发福袋活动,强化用户参与感。这种多智能体协作,使数字人具备媲美真人团队的控场能力。

  • 文心5T的剧本生成模型、数字人视频生成大模型、直播TTS大模型,大幅提升直播脚本和互动质量。慧播星通过多模型驱动架构——整合文心大模型、DeepSeek及慧播星专属模型,构建了业内领先的脚本生成与实时互动引擎。脚本生成层面,基于文心4.5T的剧本生成模型提供了多风格智能创作能力,实现真人主播难以企及的信息密度。特别是针对垂直类目,慧播星可以提供相适应的脚本风格,比如面向图书教育商家的文采风、面向健康商家的科普风等。实时互动层面,三大模型动态择优调度,文心大模型确保基础问答稳定性、并处理需要深度推理的复杂提问,通过决策思考实时调度多智能体进行互动和问答,视频生成大模型与直播TTS大模型驱动主播完成直播互动行为。
  • 合规与安全技术领先,确保内容真实性。慧播星通过技术+机制双轨合规体系,构建了行业领先的内容真实性保障能力。

其技术层面合规在于,采用显隐双标识嵌入机制​,在生成内容中强制添加文字/语音提示(如“此为AI生成”),并在文件元数据中记录生成时间、服务商编码等隐式水印,便于监管追溯。运营层面合规在于,建立“AI初审+人工复核”混合过滤系统,高风险内容触发人工团队介入审核,以提升内容安全。

  • 全栈解决方案覆盖多环节,端到端提升客户直播能力。慧播星作为业内首个AI全栈式数字人直播解决方案,通过覆盖“形象与直播间创建-脚本生成-多平台开播-智能互动-数据运营”全流程,赋能客户实现从0到1的直播能力跃迁。其端到端价值体现在两大产品层创新。

前端制作0门槛化:支持手机H5页面一键开播,用户仅需上传短时间视频即可完成声形克隆,打破传统直播对专业设备、团队及场地的依赖;同时提供数千种预制主播形象与智能装修模板,快速生成高转化率直播间视觉体系。

中台能力无缝衔接:覆盖货架电商、视频电商、私域直播等平台,解决多平台运营割裂痛点。

  • 覆盖不同流量平台的普惠商业模式。慧播星通过构建域内免费、域外低成本的普惠商业模式,同时服务头部品牌和中长尾商家。

在百度域内,商家可零成本启用直播服务。从形象克隆到AI智能脚本生成,所有开播服务免费开放,彻底消除中小商家试错门槛。对于京东、淘宝等百度域外平台,慧播星以极低门槛的SaaS和PaaS方案提供跨平台支持。比如,通过API输出形象、声音克隆技术,商家仅需上传少量素材即可生成数字人分身。商家也可以基于慧播星api接口,快速生成短视频。

慧播星这种普惠的商业架构,既满足小微商家低试错成本入局需求,又为品牌客户提供GMV增长价值,真正实现技术普惠与商业可持续的双赢。目前,累计超10万商家使用慧播星数字人,在电商、教育、法律、健康等30+行业深度应用,内容创作覆盖情感、热点、文化历史、军事等10+领域。值得注意的是在2025年百度双11,83% 的商家使用了数字人直播。

典型客户:

王老吉、蒙牛、罗永浩、爱弥儿

 

3.6 Agent开发管理平台

市场定义:

Agent开发管理平台是企业级AI战略的核心中枢和全生命周期管理工具。它以大语言模型为基础,通过提供低代码/无代码的开发环境、丰富的工具/插件生态、RAG等企业级增强技术,并涵盖Agent编排、测试、部署、运维和安全审计等功能,旨在帮助企业的IT部门和业务人员快速、安全地构建、管理和迭代适应企业复杂业务场景的Agent应用。

甲方终端用户:

核心终端用户是大型企业的IT部门、业务部门,以及首席信息官(CIO)。

甲方核心需求:

企业对Agent平台的需求已超越单纯的技术采购,转变为寻求“应用生态构建、业务价值落地和自主可控能力”。在“自上而下”的AI战略驱动下,企业不仅需要一个平台,更需要厂商提供落地规划咨询和初期定制开发服务,以确保Agent能准确解决长尾场景和业务流程优化问题,最终实现内部团队的全员赋能与自主开发。企业核心需求集中在四大方面:平台需成为全员赋能的引擎,快速解决长尾场景效率问题;要求厂商提供落地规划与定制开发服务,加速价值实现;要求Agent执行过程白盒化、可观测,满足安全审计需求;必须支持多Agent协同,以支撑复杂的跨系统业务流程。

  • 平台是全员赋能的引擎:需要快速解决长尾场景的效率问题。大型企业实施AI战略的核心目标之一是“全员赋能”。这要求Agent平台必须具备低门槛、易用性高的特点,使业务人员能够参与到Agent的开发和使用中。关键价值在于通过Agent解决大量特定且分散的“长尾场景”问题,直接提升员工的工作效率和任务处理能力,将Agent作为提升组织潜力和效率的有效工具。
  • 不再只求一个工具:更要求配套的落地规划咨询与初期定制开发服务。企业在引进Agent平台时,迫切需要厂商提供应用规划咨询服务,协助进行应用场景的选择、优先级排序以及投资回报率(ROI)评估,以确保AI投资的精准性。此外,企业期望厂商能提供1-2个定制化的Agent应用开发,作为平台技术实力和业务适配性的“示范”,加速平台在企业内部的价值体现。
  • 拒绝黑箱操作:执行过程必须是白盒化、可观测的。企业对Agent的执行过程有强烈的安全与审计需求。平台提供的Agent不能是简单的“黑箱”操作。企业要求Agent的执行过程能够白盒化,即能够清晰地观测到Agent调用了哪些工具(API)、执行了哪些步骤、推理链是如何展开的,以便于故障排查、风险控制和满足合规审计的要求。
  • 必须支持多Agent的协同:才能支撑复杂的跨系统业务流程。单一Agent只能解决简单的任务,难以支撑复杂的企业业务。企业对平台的期待是能够实现多Agent协同,即多个不同职责的Agent能够有效协调,共同完成一个规模更大、步骤更复杂的跨系统、跨部门的业务流程任务。此外,企业对平台在流程执行和控制上的要求非常高,期望平台不仅能做“决策”,还能做“执行”,并能自动感知流程的异常,进行自我调整。

厂商能力要求:

厂商的能力要求已从提供基础的开发环境,升级为构建“模型增强技术、灵活架构、全周期治理、专业服务”的复杂体系。核心在于通过RAG和插件生态增强Agent能力,通过低代码/无代码降低开发门槛,并通过咨询与开发服务保障应用的成功落地和企业自主可控能力的培养。厂商能力要求聚焦在四大关键点:具备企业场景增强技术栈(RAG、插件生态)的深度集成;平台需同时支持“业务员友好”的无代码和“开发者友好”的全代码配置;具备将大模型微调至“小参数、高精度”的能力,实现成本与性能平衡;必须配备专业的落地规划咨询与Agent开发服务团队。

  • 必须具备企业场景增强技术栈:尤其是RAG、插件生态与模板库的深度集成。To B场景的应用成功率依赖于大模型的定制化能力。厂商平台必须深度集成先进的企业场景增强技术,尤其是RAG(检索增强生成)技术、多模态存储和上下文理解增强。同时,需要构建一个功能丰富的公共插件中心和应用场景模板库,支持用户通过配置快速调用现有API,并能基于行业模板快速搭建和扩展Agent功能。
  • 平台需同时支持“业务员友好”的无代码:和“开发者友好”的全代码配置。为实现全员赋能,平台必须提供低门槛、高效率的开发环境。这要求平台具备无代码/低代码的拖拽配置方式,让业务人员轻松上手;同时,也必须保留全代码配置选项,以满足IT部门开发更复杂、更定制化AI应用的需求。这种双轨制的设计是满足不同企业用户群体,实现普惠AI的关键。
  • 具备将大模型微调至“小参数、高精度”的能力:实现成本与性能平衡。通用模型在特定企业工具调用上效果欠佳且运行成本高昂。厂商需要具备对小参数模型(如7B、13B)进行专业微调的能力,使其在特定企业内部工具调用和业务场景上的准确度,超越未经训练的、参数更大的模型。这能帮助企业在保证Agent调用准确度的同时,大幅降低GPU算力投入和运营成本。
  • 厂商必须配备专业的落地规划咨询:与Agent开发服务团队。平台厂商不仅是软件销售方,更需成为企业的AI落地合作伙伴。厂商必须构建专业的咨询服务团队,帮助企业识别高价值、高可行的应用场景,并制定清晰的实施路线图;同时,Agent开发团队则负责快速交付首批定制化Agent,为企业内部团队后续的自主开发和维护提供经验和模板。

入选标准说明:

  1. 符合Agent开发管理平台市场分析的厂商能力要求;
  2. 近一年厂商在该市场至少服务1家企业;
  3. 近一年厂商在该市场的收入规模至少在50万元。

代表厂商评估:

245f4b5ce955143564d4cc8ed1635a2d

浩鲸科技

厂商介绍:

浩鲸云计算科技股份有限公司(简称“浩鲸科技”)是一家全球领先的数字化技术和服务的提供商,致力于帮助全球客户实现向数字经济的跨越。公司成立于2003年,迄今已为全球80多个国家和地区的电信运营商、公共服务部门及其他行业客户提供数字化转型解决方案和产品服务。

产品服务介绍:

“鲸智百应”是浩鲸科技推出的一款企业AI操作系统,旨在解决AI从“外挂工具”向组织“原生能力”转变的问题。该产品架构包含“三门户、五引擎”。其中,五大引擎(知识、决策、流程、记忆、插件)构成了智能服务的核心底座,实现了从意图理解、任务分解到自动执行的闭环。特别是其独有的“Data Cloud”和“Function Cloud”,利用UI-Agent等技术,能够在不改造原有业务系统的前提下,实现对企业存量数据和功能的低成本、无侵入式调用和协同、增强智能化能力。产品支持快速构建具有岗位属性的“数字员工”,覆盖财务、人资、销售等高频场景,助力企业构建人机协同的新型组织形态。

fb07121ffc3cfc6ad148be190fbc1306

图:鲸智百应-产品门户

厂商评估:

浩鲸科技凭借其在电信运营商及政务等复杂行业积累的深厚数字化转型经验,以及在全球项目部署中沉淀的研发能力和客户网络,在Agent开发管理平台市场中展现出差异化的竞争优势。其核心产品“鲸智百应”跳出了单一Agent开发工具的范畴,明确了“企业AI操作系统”的差异化定位,致力于解决大型企业在智能化转型中面临的系统割裂、协同困难及安全合规等深层次痛点。浩鲸科技通过创新的“双云”(Function Cloud与Data Cloud)技术架构,以低侵入方式有效攻克了存量系统集成的行业难题;同时,依托全球化的交付网络和对行业大B客户需求的深刻理解,在安全治理与规模化落地方面表现稳健。以下将从技术架构创新、产品战略定位、交付落地能力及安全合规体系四个维度进行详细评估。

  • 通过“UI-Agent”与双云技术架构,以低侵入、低成本方式解决企业存量系统集成与数据孤岛难题,大幅降低了AI落地门槛。

在企业级Agent落地过程中,最大的阻碍往往来自于各异的存量业务系统(如老旧的ERP、OA等)以及封闭的数据接口。传统模式下,企业需要进行成本高昂的API改造或数据中台建设才能支持AI应用。鲸智百应通过Data Cloud和Function Cloud极大降低了实施成本和风险。

Function Cloud利用大模型技术实现对业务系统界面的理解与操作模拟,支持查询、代理操作及控制权切换等模式,能够在不依赖原厂接口开放的情况下,实现对各类复杂系统的功能零侵入触达。这种方式不仅规避了对原有IT系统的侵入性改造,还保证了操作的高准确性。

与此同时,Data Cloud通过智能化查询逻辑挖掘,从表单界面、报表等多个源头获取数据,结合API接入与SQL生成能力,为企业构建了一个低成本的“数据神经网络”。这种“界面阅读+接口调用”的混合模式,有效平衡了技术先进性与企业IT现状的现实矛盾,使得Agent能够快速具备处理复杂业务数据的能力,而不仅仅停留在闲聊或简单的知识问答层面。对于信息化建设历史包袱较重的中大型企业而言,这一技术特性显著提升了Agent项目的可实施性与投资回报率。

  • 超越单一Agent,确立“AI操作系统”战略定位和目标,通过决策与记忆引擎实现跨场景、多智能体的深度编排与协同。

鲸智百应在产品理念上并未止步于提供一个Agent开发工具,而是强调构建“企业AI操作系统”。在实际业务场景中,单一功能的Agent往往难以满足复杂的端到端流程需求,且容易形成新的“智能孤岛”。鲸智百应通过内置的“决策引擎”,实现了基于用户意图的精准路由与任务分解,能够根据业务需求动态调度不同的Agent或技能插件协同工作。例如,在LTC(线索到现金)流程中,系统可以自动协调合同审查、利润测算、风险分析等多个数字员工共同完成任务,而非让用户在不同应用间切换。此外,鲸智百应的“记忆引擎”构建了企业级的记忆图谱,涵盖短期交互记忆与长期用户画像。这使得数字员工不仅具备执行能力,还能随着交互积累不断沉淀知识与偏好,实现“越用越好用”。

这种从底层操作系统视角出发的设计,使得企业能够对数字员工进行统一的身份授予、权限管控和全生命周期管理(创建、应用、评估、迭代),从而真正支撑起“人+数字员工”的新型组织架构,而非堆砌零散的AI应用。

99918e3b5ca0ecb963f8096d14884a7d

图:鲸智百应-多智能体协同

  • 依托深耕运营商行业的交付底蕴与全球化服务网络,具备处理高并发、复杂业务逻辑的规模化落地能力,有效保障项目交付质量。

浩鲸科技起家于电信运营商领域,该行业对系统的稳定性、业务逻辑的复杂性以及数据处理的规模化有着极高的要求。这种行业基因使得浩鲸科技在面对大型企业的复杂场景时具备天然的优势。浩鲸科技已助力运营商、政务、能源等行业客户构建了大量智能体应用,沉淀了面向企业客户服务过程中“隐性技能”——即专家经验与最佳实践,这种经验被融入到“鲸智百应”产品中。通过提供融合专业知识与实战技能的预制智能体模板,极大提升企业场景落地效率和质量,有效缩短了从构建到投产的周期。

在交付层面,浩鲸科技在全球拥有50多个分支机构和强大的本地化交付团队。对于大型B端企业而言,AI项目的落地往往不仅是软件安装,更涉及业务流程梳理、场景共创以及持续的运营调优。浩鲸科技能够提供“咨询+产品+交付+运营”的一体化服务,协助企业进行顶层设计与场景规划,解决企业“有工具却用不起来”的落地挑战。这种重服务的交付模式,在当前Agent市场普遍偏向轻量化SaaS工具的背景下,构成了浩鲸科技服务中大型客户的核心壁垒。

  • 构建全链路可信AI治理框架,通过私有化部署与“人类在环”机制,精准契合央国企对安全合规的严苛要求。

针对目标客户群体(主要是央国企及行业大B)对数据安全与合规性的高度敏感,浩鲸科技将安全治理作为百应产品的核心基石。在部署模式上,产品支持完全私有化部署,确保核心数据与模型不出域,满足行业监管要求。在运行机制上,构建了“人类在环”(Human-in-the-loop)的安全架构,对于涉及审批、资金往来等敏感操作的Agent,系统强制引入人工确认与审计环节,防止AI出现幻觉或执行违规操作,确保业务流转的可信与可控。同时,产品内置了统一的权限管控体系,能够对数据权限、知识权限、插件权限以及数字员工的调度权限进行细粒度管理。这种严密的权限隔离机制,使得企业在推广全员智能化应用时,能够有效规避数据泄露风险。

此外,浩鲸科技结合其与中国企业改革与发展研究会、责任云等机构合作发起的AI原生组织课题研究,在政策合规解读与标准制定方面走在行业前列,能够为客户提供符合国家政策导向(如“人工智能+”行动)的安全落地路径。

8aa20c57a307b628f80a3d1e7f93396b

图:鲸智百应-数字员工

典型客户:

中国移动、中国电信、南方电网等

 

1cf414fe1028a850f8a3921cbaa4e7a7

容智信息

厂商介绍:

容智信息成立于2016年,总部位于上海和无锡,是一家专注于智能体综合解决方案的提供商。公司核心产品体系包括HyperAgent智能体开发平台和ReportAgent报告分析智能体。

容智信息的市场认可度持续提升,已连续两年(2024、2025)入选Gartner的《2024中国智慧城市和可持续发展成熟度曲线》和《2025中国信息通信技术(ICT)成熟度曲线》报告。

其核心产品HyperAgent智能体开发平台表现突出,例如在2025年获得某国际保险机构认可并建立深入合作,为其构建覆盖客户洞察、精准营销、智能核保与实时风控的全链路智能体系。

容智信息已积累软件著作权与专利超300项,目前服务于千余家客户,客户群体覆盖央国企、世界五百强以及金融、能源、高端制造等重点行业。

产品服务介绍:

容智信息的产品生态体系聚焦于HyperAgent智能体开发平台 和ReportAgent报告分析智能体

  • HyperAgent智能体开发平台的核心设计理念是平衡智能体的反思规划循环与流程执行。它集成了企业级iBot工作流引擎,用于编排和管理复杂的自动化任务。该平台具备快速构建智能体的能力,并强调高安全性,支持离线环境和私有化部署模式,旨在满足央国企和金融等对数据合规性与系统可靠性有严格要求的行业需求。
  • ReportAgent报告分析智能体旨在覆盖分析报告的整个生命周期,提供自动化的数据分析能力。该产品在数据预处理阶段采用“语义理解与数据处理”双引擎架构,以提升分析结果的准确性、可控性和可追溯性。其目标是帮助企业构建可大规模复制的智能体集群,推动企业智能化进程。

厂商评估:

容智信息的智能体技术经历了从Workflow+LLM到L4级企业智能体平台的架构跃迁,实现了由流程配置向大模型自主驱动的转变。HyperAgent平台采用“自主规划与流程编排并重”的混合架构,同时通过深度融合企业级iBot工作流引擎,有效解决了智能体在操作依赖桌面客户端的传统系统时的行业痛点。在开发模式上,平台致力于智能体开发的平民化,核心优势在于其自然语言构建和零代码配置能力,使用户无需学习复杂的提示词工程,即可通过中文描述目标并直接修改智能体的思维逻辑,成为业务人员友好型工具。平台在设计上专注于企业级可用性,提供开箱即用的成熟组件、完善的权限管理,以及全生命周期安全可观测性。此外,专注于数据分析的ReportAgent,致力于实现分析流程的精准计算、精准理解用户意图和自主可控的平衡,并支持分析智能体模板的规模化克隆与分发,以加速企业内部分析能力的普及。

  • 容智信息在企业级智能体技术的演进上,经历了明确的阶段性发展,形成了基于大模型与流程管理的平台能力。

2022年 (Workflow+LLM): 容智信息将大模型能力融入BPM业务流程管理系统,旨在解决传统RPA技术在复杂、高变场景中适应性差、规则固化的问题。此阶段形成了智能体技术的早期基础,为金融、政务等行业的复杂业务流程提供了智能化支持。

2023年 (Workflow Agent): 技术架构进一步升级,基于RPA工作流推出了低代码(拖拉拽式)的工作流Agent。这一迭代降低了智能体的开发门槛,支持业务人员通过模块化拼接方式快速创建和部署智能体应用。

2025年 (L4级企业 Agent): 容智推出了一款L4企业级智能体开发平台。该平台的核心能力是支持自然语言构建Agent,即用户仅需输入业务需求,平台便能自动分解任务、调度工具并完成应用构建,从而实现了高度自动化的应用开发模式,突破了对传统固化工作流的依赖。

333a05ce214b82177eae6252a0bdc6fa

图:容智Agent技术发展历程

  • HyperAgent平台采用“自主规划与流程编排并重”的巧妙架构,有效平衡了大模型的灵活性与企业级流程的稳定性和可控性。

容智信息的智能体平台在架构设计上,区别于纯依赖大模型自主规划或仅基于预设固定流程的单一模式。该平台采用了“两阶段”混合架构,将大模型驱动的反思规划(Planning)与规则驱动的流程执行(Execution Workflow)进行融合。这一设计旨在解决企业级应用中的核心矛盾:即流程需要适应动态变化的业务场景(灵活性),同时必须保证核心流程执行的准确性、安全性和可观测性(稳定性)。在任务执行过程中,平台能够利用大模型的能力进行任务拆解、工具选择和动态路径优化,以处理流程之外的突发情况;同时,对于关键步骤,则依托稳定、可审计的流程引擎进行执行。这种结合确保了智能体在具备高阶认知能力的同时,能够满足中大型企业对系统集成和流程管控的严格要求。

b675e5ebc92b71cc11bf4a2c8c08811f

图:HyperAgent架构

  • 容智信息致力于通过平台设计,实现自然语言构建智能体,大幅降低开发门槛,使其成为业务人员友好型的开发平台。

HyperAgent平台开发模式以“自然语言构建”和“零代码配置”为主要特点。平台提供的交互方式和可视化界面旨在让具备基本业务逻辑的业务人员(而非专业技术工程师)也能创建、调试和部署智能体。

关键在于,该平台的设计理念是无需用户学习复杂的提示词工程,只需通过中文描述目标即可自动完成智能体的任务规划和构建。此外,平台允许用户通过中文语言直接修改智能体的思维逻辑和运行策略,将智能体构建的重心从技术细节转移至业务规则的定义和场景的梳理上,从而加快了智能体在企业内部的批量化生产和部署速度。

631bcdef20e37f7f92091cbdf2e0c3dc

图:自然语言交互:业务人员可以轻松地对智能体通过中文语言进行优化调整

  • L4级智能体:从流程配置到大模型自主驱动的架构跃迁。

容智信息将其HyperAgent平台定位为L4级企业智能体平台,这一等级参照了业界对Agent能力的划分标准(L0至L5)。通常,L0-L2级智能体主要依赖预设规则和静态工作流,仅支持基础工具调用和有限推理;L3级则在此基础上引入记忆和反思能力;L4级的核心特征在于自主学习与动态泛化。

容智信息宣称其L4级平台实现了对传统L2级“Workflow驱动”模式的超越,具备LLM自主驱动的关键特征:

  1. 构建方式:L4级平台通过自然语言驱动实现智能体的全自动、零代码构建,而L2级则依赖人工的Workflow配置。
  2. 任务处理:L4级支持全自动智能调度和动态流程演进,能够自主规划和编排任务,解决L2级依赖人工干预执行和静态规则限制的问题。
  3. 技术架构:L4级平台的核心是自主决策引擎,区别于L2级的模块化工具集集成。
  4. 用户门槛:L4级强调零代码交互和业务人员友好,突破了L2级对专业技术人员的专属依赖。

HyperAgent平台的核心能力体现在自主规划、自主调度、自主编排和自主创建上,旨在实现智能体全程自主构建,无需人工进行“手搓式”配置,并能自动推荐和选择工具、自动生成推理步骤和业务流程。

  • 企业级可用性:面向生产环境的成熟化平台与全生命周期安全观测。HyperAgent平台在设计上专注于企业级可用性,这体现在其对平台成熟度的全面保障和安全可观测性的深度支持。
    1. 平台成熟度与集成能力:HyperAgent是一个完整且成熟的开箱即用商业智能体开发平台,无需客户在基础技术框架上进行大量的二次开发。平台内置了全面的企业级组件,包括:内置知识库、工具调用、工作流引擎,以及企业级的权限和安全管理模块。在集成性方面,平台提供了丰富的连接器,支持与主流企业协作系统(如企微/钉钉)以及通过SDK/API等方式与各类业务系统进行深度集成,保障了其在复杂企业环境中的适用性。
    2. 安全可观测性与性能优化:平台致力于将智能体执行过程从传统的“黑盒模式”转化为透明且可观测的机制。智能体运行过程中的推理、思考规程和执行步骤均可被完整追踪和可视化。此外,平台支持对智能体执行的所有路径进行可视化挖掘,这不仅满足了企业对运行合规性和追溯性的要求,也极大地便利了技术人员优化和提升智能体的性能和准确率。
  • ReportAgent旨在贯穿企业数据分析报告的全生命周期。其核心能力架构可概括为三个相互支撑的模块:业务语义理解、高精度计算分析和多格式报告生成。

业务语义理解:平台具备深度语义理解能力,无需大量人工标注即可识别金融术语等行业特定词汇和企业内部的业务术语。通过对接企业知识库、指标库、算法库和数据库,该模块能够基于企业特有的财务知识和历史分析经验,例如在分析营收增长时,精准提炼并解释背后的驱动因素,从而实现与业务场景的高度对齐。

高精度计算分析:平台的核心是高精度计算引擎,确保分析结果的可靠性。它支持自动执行杜邦分析等复杂的、行业特定的计算模型。ReportAgent宣称其分析结果经过客户团队手动复核,能够达到高准确率,旨在消除传统BI工具结果存疑、需二次验算的痛点,提升分析结果的可信度与生产效率。

可视化报告生成:该模块将业务分析逻辑与视觉表达进行深度融合。它突破了传统数据分析工具仅输出图表或单一数据视图的局限,能够支持生成包括Word、PPT、Excel 在内的多种格式报告,直接满足企业对正式、结构化文档的需求。

e7ee5bee24edf40ed205d269a70ddd89

图:ReportAgent能力展示

  • ReportAgent在数据分析和报告生成领域,聚焦于四大核心能力,以确保其在企业级分析应用中的可靠性与效率。

数据计算精准性:ReportAgent致力于确保分析报告中的计算逻辑和指标统一性。通过内置行业模型和报告模板规范,实现指标口径的精准管理,这对于金融、财务等对数据严谨性要求极高的行业尤其重要,有效避免了分析中常见的“数据打架”和“结论矛盾”问题。

精准理解用户意图:ReportAgent具备理解行业黑话和各行业行话的能力,能够基于中文输入,精准理解分析师的意图和业务表达。这一能力使得 ReportAgent能够有效衔接自然语言输入与复杂的后台数据处理逻辑,实现对分析指令的精准规划。

自主性与可控性平衡:ReportAgent在提供数据探索(自主)能力的同时,实现了分析过程的合规可控。这体现在既能实现快速分析,又能保障数据安全和分析结果的合规性,通过内置的管理机制,避免了自由探索可能导致的数据泄露或分析结论失控的风险。

分析智能体克隆与分发:ReportAgent支持分析智能体模板的规模化复制和部署。分析智能体模板可实现一次构建,百处复用,能够快速克隆和分发到企业内的多个部门或不同的分析场景中。这一能力显著减少了为重复分析任务而进行的资源投入,大幅压缩了分析模块的推广部署成本,加速了企业级分析能力的普及。

典型客户:

国银金租、东北证券、中国移动、中国银行

 

0621b361fecbb3d0bf1f12c2cd58f630

拓尔思

厂商介绍:

拓尔思信息技术股份有限公司(简称“拓尔思”)创立于1993年,是中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商。公司2011年创业板上市,是A股第一家上市的大数据技术企业。拓尔思以“数据+智能”为核心战略,致力于通过自主可控的技术、优质的数据资产与全栈的解决方案,赋能千行百业实现数智化升级。

产品服务介绍:

拓尔思推出的“拓天智能体底座”是一款面向政企客户的低代码/无代码开发环境,旨在通过可视化工作流编排,支持用户快速构建基于大模型的行业应用。该平台核心功能在于将大模型能力与企业私有知识库、业务系统及百余种MCP工具进行串联,实现复杂业务流程的自动化。在技术路径上,产品融合了检索增强生成(RAG)与知识图谱技术,以解决专业场景下的逻辑推理与准确性问题,重点覆盖专业报告生成、数据智能分析及合规审查等业务场景。此外,作为拓尔思全栈AI解决方案的枢纽,该平台支持国产化硬件适配与全链路私有化部署,能够与底层的AI训练平台及数据治理工具打通,满足大型组织对数据安全与自主可控的刚性需求。

厂商评估:

在Agent开发管理平台市场中,拓尔思展现出了鲜明的“行业派”与“工程派”特征。与其说拓尔思是在交付一个单纯的技术底座,不如说它是在交付一套结合了深厚行业Know-how与全栈AI工程能力的解决方案。面对大模型落地过程中普遍存在的“准确性不足”、“数据孤岛”以及“硬件适配难”等核心痛点,拓尔思并未盲目追求模型参数的规模竞赛,而是选择了一条务实的路径:通过引入知识图谱技术增强推理的严谨性,利用Agent工作流重构专业报告生成等高价值场景,并深耕国产化信创环境下的软硬适配。依托其在政务、金融等领域的长期积累及全国性的服务网络,拓尔思成功构建了以“数据安全可控”和“业务场景闭环”为核心的差异化竞争壁垒,特别适合对合规性、准确率有极高要求的政企客户。

  • 深厚的行业积累与“服务+技术”双轮驱动,是赢得B/G端市场客户信任的基石。在Agent平台的商业化落地中,技术指标往往不是单一的决策依据,客户的信任构建尤为关键。拓尔思的竞争优势首先体现在其对政务、媒体、金融等特定行业业务逻辑的深刻理解上。与纯技术背景的初创厂商不同,拓尔思拥有三十余家覆盖全国的分支机构,这使其能够深入一线业务现场,精准捕捉如“老人带新人”的隐性培训需求或复杂的公文流转规范。在实际项目中,单纯的大模型技术往往难以直接解决行业特有的痛点,例如某些敏感单位或特定行业存在大量的专业术语,通用大模型对此不仅无法理解,甚至会产生误读。拓尔思通过“驻场服务+行业微调”的模式,能够快速将行业知识转化为模型可理解的指令,这种“讲客户听得懂的语言”的能力,在POC(概念验证)阶段往往成为胜负手。此外,针对政企客户内部复杂的利益平衡,拓尔思展现出了成熟的应对策略,既能够满足信息化部门的规划指标,也能通过解决繁杂事务来缓解基层业务人员对AI“取代自我”的抵触情绪,从而推动项目从试点走向实战。
  • 采用“知识图谱+向量检索”双引擎架构,有效解决了通用模型在专业领域的“幻觉”难题。准确性是Agent能否在专业场景落地的生命线,尤其在政务问答和政策解读等场景中,错误的回答(如捏造政策条款)是不可接受的。拓尔思敏锐地捕捉到了单一RAG(检索增强生成)技术的局限性:单纯依靠向量检索难以处理复杂的逻辑关联和多跳推理。为此,拓尔思在产品架构中深度融合了知识图谱技术。知识图谱提供的结构化知识网络,为大模型的生成过程提供了强有力的逻辑约束和事实支撑,类似于微软推行的Graph RAG路径。在实际运行中,系统不仅检索文档片段,更在图谱层面进行知识推理,并在输出端引入独立的“溯源检查模型”作为后置审查流程,确保每一个回答都有据可依。这种技术组合拳,使得平台在处理错综复杂的业务数据时,能够达到近乎百分之百的政策溯源准确率,从而满足了严肃业务场景对“可信AI”的严苛要求。
  • 从“对话式交互”向“Agent工作流”进化,聚焦专业报告生成等高价值场景,实现了可量化的提效成果。拓尔思在产品演进中摒弃了将AI泛化为“万能聊天助手”的思路,转而主攻特定业务流程的自动化。其中,“专业报告生成”已成为其平台最具代表性的杀手级应用。针对企业及政府部门撰写严谨分析报告耗时长的痛点,拓尔思并未简单地让大模型“一键生成”往往空洞无物的文本,而是采用了典型的Agent思路:将报告撰写拆解为框架规划、数据获取、指标计算、内容填充与润色等多个子任务。平台通过调用数据智能体与底层数据平台打通,先进行确定的数据治理和指标加工,再将准确的数据“喂”给模型进行分析。这种“先治理数据,后模型生成”的模式,不仅规避了大模型在数值计算上的短板,更让生成的报告具备了经得起考究的专业深度。从实际案例来看,这种模式能将原本耗时数天的工作缩短至分钟级,极高的效能提升使得用户一旦上手便产生强烈粘性,验证了Agent在深度业务场景中的巨大潜力。
  • 具备全栈工程化能力与国产硬件深度适配经验,为数据主权与信创合规构建了坚实的安全护城河。对于央国企及政府客户而言,数据不出域和自主可控是底线要求。拓尔思的优势在于其提供的是从底层数据治理、模型训练微调到上层应用编排的“全栈式”能力。面对国内复杂的信创环境,拓尔思投入大量资源完成了对华为(昇腾)、海光、寒武纪等国产算力硬件的深度适配,解决了异构算力推理框架不统一、算子库不兼容等工程难题。这使得拓尔思能够在客户的私有内网环境中,快速部署并调试出性能达标的本地化模型。更重要的是,针对封闭域数据的训练需求,拓尔思具备在客户本地环境进行模型精调(Fine-tuning)的能力,这不仅解决了数据隐私顾虑,更让模型能够真正理解企业内部的私有数据与业务逻辑。这种“软硬一体”且高度本地化的交付能力,构成了拓尔思在信创市场中难以被替代的核心竞争力。
  • 摒弃“唯参数论”的务实落地策略,强调模型性价比与交互方式的场景化适配。在行业普遍追逐千亿参数大模型的浪潮下,拓尔思表现出了难得的冷静与务实。其评估指出,在大多数垂直业务场景中,经过高质量数据微调的10B左右参数规模的模型,往往在准确率和响应速度上优于未经调整的超大模型,且能大幅降低客户的硬件采购成本(CapEx)与运营成本(OpEx)。这种策略极好地契合了当前政企客户“既要效果好,又要预算可控”的实际需求。此外,在交互形态上,拓尔思也突破了单一的Chat(对话框)思维。例如在110接警或合规审查场景中,平台支持AI以“静默观察者”的身份嵌入后台,实时监听语音或扫描文档,自动提取关键要素并填入业务系统表单,而非强迫业务人员通过对话框与AI交互。这种将AI无感嵌入现有作业流程的设计理念,极大降低了系统的使用门槛和推广阻力,体现了厂商对业务场景人性化的深刻洞察。

典型客户:

中国环境报、人民出版社、中国医学科学院医学信息研究所、国网能源研究院、南京图书馆

 

3.7 对话式AI

市场定义:

对话式 AI是基于大语言模型的全栈式技术平台,它深度整合了语音识别(ASR)、语音合成(TTS)、多模态交互和实时互动技术(RTC)。它的核心价值在于将大模型的认知和推理能力与真人般的自然交流体验相结合,提供亚秒级低延迟、高拟人度的人机交互界面,广泛应用于智能客服、虚拟人、智能硬件和 AI 助手等需要自然语言交互的场景。

甲方终端用户:

核心终端用户是企业的IT技术部门、产品研发部门,以及智能硬件制造商(如AI教育设备、智能穿戴设备厂商)。

甲方核心需求:

客户对对话式 AI 的需求已经从“基础交互”升级为“拟人化、生产级体验”。核心聚焦于极致的低延迟和高拟人度的交互,确保 AI 能像真人助手一样自然地、实时地提供服务。同时,兼容现有技术资产和适配多模态与硬件环境是保障项目落地的关键。对话式 AI 的核心需求集中在:极致的低延迟,消除用户等待焦虑;无缝兼容现有LLM资产,避免重复投资;多模态上下文理解,实现更智能的交互;以及软硬件一体化适配,解决AI硬件的落地难题。

  • 交流不能有“等待焦虑”:响应延迟必须降到“秒级”甚至“亚秒级”。实现自然流畅的交流是核心需求。这不仅要求系统的声音拟真,更要求具备极低延迟的交互能力,从用户发起到 AI 开始响应的时间必须控制在1秒甚至亚秒级以内,以避免用户产生“等待焦虑”。同时,必须支持精准的动态打断,能区分用户的无意停顿和有效指令,实现人与人之间自然交流的节奏感。
  • 不能重复“造轮子”:语音能力必须能无缝兼容现有的LLM资产。许多企业已投入大量资源采购或训练了基础大模型,其技术资产已经固化。因此,他们期望对话式 AI 的语音交互和多模态能力能够作为服务层,无缝对接这些现有的、不同架构的大模型,从而最大化利用已有的技术资产,避免重复投资和资源浪费。
  • 交互不能仅限于“能说会道”:必须实现“眼观六路”的多模态上下文理解。对话式 AI 的应用价值正从纯文本和语音向多模态扩展。企业需要系统能够整合视觉(图像、视频)、声纹识别、环境音降噪等能力,实现多模态上下文的感知和理解。例如,通过声纹识别知道“谁”在说话来提供个性化服务,或通过图像输入进行 AI 批改作业、识别物体进行知识问答等。
  • AI硬件的“最后一公里”:需要软硬件一体化适配低功耗环境。针对 AI 硬件(如 AI 教育设备、智能终端)场景,客户不仅需要软件高性能,更要求对话式 AI 方案能够向下适配硬件环境。厂商必须解决芯片算力、功耗和内存限制等问题,提供软硬件一体化的支持,确保在有限的终端资源下仍能提供流畅、高质量的对话体验。

厂商能力要求:

厂商的核心能力壁垒在于实时互动技术与大模型工程的深度融合。要求厂商不仅提供极速、拟人的交互技术,更需要具备多模型、多模态的灵活适配能力,以及针对 AI 硬件的全栈式、软硬一体化的解决方案交付能力。厂商能力要求聚焦在四大关键点:具备实时互动的工程能力,确保亚秒级交互;平台需作为“万能连接器”,灵活适配多模型多模态组件;面向AI硬件,提供“芯片级”的软硬一体化优化方案;TTS需具备“情感拟人”和“克隆”级别的高级能力。

  • 核心竞争力是“实时互动”的工程能力:确保亚秒级的交互体验。厂商必须具备实时互动技术的深厚积累,这是保障低延迟的关键。要求厂商能够通过全链路的工程优化,包括音频传输优化、低延迟编解码、端侧降噪处理等,将从用户发声到 AI 开始回复的端到端延迟控制在亚秒级,为流畅的对话提供技术基础。
  • 平台必须是“万能连接器”:灵活适配主流大模型与多模态组件。厂商平台需要具备高度的模型适配灵活性和开放性。必须能无缝对接包括通用、行业、开源在内的多种大模型,并支持主流 TTS 供应商的切换和音色定制。这种灵活的架构是实现兼容现有 LLM 资产和快速集成如声纹识别、视觉处理等多模态组件的前提。
  • 面向 AI 硬件:提供“芯片级”的软硬一体化优化方案。厂商必须拥有软硬件一体化的交付能力,尤其是在终端侧进行深度优化。这要求厂商在芯片选型、功耗设计、内存管理等环节提供指导或方案,通过模型轻量化和推理优化,确保对话式 AI 能在有限的硬件性能和电池容量下,实现高性能、低功耗的稳定运行。
  • TTS要具备“灵魂”:声音定制需达到情感拟人与克隆级别。厂商需提供高品质的语音合成(TTS)能力,不仅限于清晰度,更要求具备情感、语调和自然的口癖等拟人化特征,以增强用户沉浸感和真实感。同时,需支持企业进行品牌音色定制或声纹克隆,以帮助客户构建独特、可识别的 AI 人格。

入选标准说明:

  1. 符合对话式AI市场分析的厂商能力要求;
  2. 近一年厂商在该市场至少服务1家企业;
  3. 近一年厂商在该市场的收入规模至少在50万元。

代表厂商评估:

7d9daac2846cf3d72356e4ad2f309f6d

声网

厂商介绍:

声网成立于 2014 年,是全球实时音视频云服务开创者,为人与人和人与智能体的音视频互动提供最佳体验。开发者只需简单调用声网 API,即可在应用内构建诸如对话式 AI、音视频通话、直播等多种实时互动场景。2020 年 6 月 26 日,声网母公司 Agora, Inc. 成功登陆纳斯达克,股票代码为“API”。

产品服务介绍:

声网的核心产品体系已从基础的实时音视频(RTC)延伸至“对话式 AI”全栈矩阵。其核心产品为“对话式 AI 引擎”,该引擎支持与全球主流的大语言模型集成,提供低至 650ms 的端到端响应延迟和智能打断功能。围绕该引擎,声网推出了“对话式 AI 开发套件”,针对智能硬件提供软硬一体化方案,支持主流芯片与多模态交互。此外,声网还发布了“对话式 AI Studio”低代码编排平台和“AI 模型评测平台”,前者用于快速搭建和编排智能体,后者帮助开发者科学评估和选择 ASR、LLM 及 TTS 模型。底层基础设施方面,声网依赖其自研的全球软件定义实时网 SD-RTN™ 保障高并发下的网络传输质量。

厂商评估:

作为实时互动云服务领域的头部厂商,声网在生成式 AI 浪潮中迅速完成了从“传输管道”提供商向“智能交互”基础设施服务商的转型。不同于从模型层切入的 AI 初创公司,声网的核心竞争力在于利用过去十余年在实时网络传输和音频处理上的工程化积累,解决了大模型落地过程中最为棘手的延迟控制、即时打断及复杂网络环境下的稳定性问题。通过构建开放、中立的生态位,声网将 ASR、LLM、TTS 等碎片化能力通过引擎进行标准化封装,并辅以开发套件和评测工具,极大地降低了企业集成对话式 AI 的技术门槛与试错成本。随着政策对 AI 产业落地的推动以及电话、网页、智能硬件等场景需求的规模化爆发,声网的产品矩阵已具备支撑大规模商业化应用的能力,特别是在对实时性和交互体验要求极高的场景中展现出明显的差异化优势。

  • 凭借全球软件定义实时网(SD-RTN™),构建了难以被单纯模型厂商复制的工程化低延时壁垒。在对话式 AI 的落地过程中,单纯依靠模型推理速度的提升已难以满足商业级应用对实时性的苛刻要求。声网的护城河在于其耗时十余年构建的全球实时网络 SD-RTN™,这使其能够应对全球范围内散点爆发的交互需求,尤其是在跨国、跨运营商以及弱网环境下的传输稳定性。当前的对话式 AI 应用往往涉及“点对网”的复杂拓扑结构,即智能体可能集成不同云厂商的语音合成与大模型服务,这种链路导致延迟极难控制。声网通过底层网络优化与端侧引擎的结合,支持低至 650ms 的端到端响应延迟,并能确保在 80% 丢包率下对话依然流畅。对于试图从模型层反向切入实时交互领域的竞争对手(如硅谷的 Eleven Labs 等)而言,这种全球范围内的网络基础设施建设和实时传输算法的积累,是短期内难以逾越的技术壁垒。
  • 坚持“被集成”的中立生态策略,通过全栈工具链解决模型选型与编排的碎片化难题。面对市场上层出不穷的大模型和语音技术供应商,声网并未选择自研大模型与之竞争,而是采取了极其开放的生态策略。声网的对话式AI 引擎目前已兼容全球几乎所有主流大模型厂商(如 OpenAI、MiniMax、智谱 AI 等)以及各类 ASR 和 TTS 服务。为了解决开发者在组合这些碎片化能力时的选择困难,声网推出了“AI 模型评测平台”,基于真实数据对不同模型的速度、质量、成本进行多维度量化评估,涵盖了 89 个模型及全球主要节点。同时,通过“对话式 AI Studio”提供可视化编排能力,企业无需编写复杂代码即可完成 Prompt 定义、插件调用及工作流配置。这种全栈式的工具链服务,实际上充当了应用层与模型层之间的“连接器”和“适配器”,不仅帮助客户规避了绑定单一模型厂商的风险,还通过标准化的接口降低了多模型集成的开发与维护成本。
  • 针对语音交互的“最后一公里”体验,在端侧信号处理与对话逻辑控制上具备深厚的技术积淀。在大模型具备了基本的思考与生成能力后,决定用户体验的关键往往在于交互的流畅度与自然感,即“最后一公里”体验。声网利用其在音频算法领域的积累,重点攻克了语音活动检测(VAD)、智能打断和噪声抑制等核心痛点。声网将 VAD 技术提升到了与语音识别同等重要的高度,通过语义 VAD 和 Turn-taking(轮次判定)算法,有效解决了 AI 抢话、反应迟钝或对背景人声误触发的问题。其“优雅打断”功能支持 340ms 的极速响应,能够过滤无语义的附和词(如“嗯”、“啊”),使人机对话节奏更接近真人交互。此外,针对噪声环境,声网引入了“选择性注意力锁定”和声纹识别技术,能够屏蔽 95% 的环境噪声并锁定特定说话人,这对于智能硬件、车载及户外移动场景下的落地具有决定性意义。
  • 通过软硬一体化的开发套件与参考设计,显著降低了生成式AI 在物联网终端的落地门槛。智能硬件被视为对话式 AI 最具潜力的增长点之一,但硬件开发涉及复杂的芯片适配、驱动调试及声学结构设计。声网敏锐地捕捉到了这一需求,推出了软硬一体的“对话式 AI 开发套件”,适配了博通、乐鑫、展锐等主流芯片平台。该套件不仅预置了优化的音频算法和连接能力,还提供了开源的参考设计,使得开发者能在“1 小时跑通 Demo,1 天完成原型”。特别是在视觉理解能力的加入后,声网的方案赋予了硬件“看、听、说”的多模态能力,支持双屏互动、摄像头实时解析等功能。这种交钥匙式的解决方案,极大地缩短了 AI 陪伴公仔、智能眼镜、家居机器人等创新产品的研发周期,加速了生成式 AI 技术在物理世界的渗透。
  • 极具竞争力的成本控制与以业务价值为导向的服务标准,推动了对话式AI 从尝鲜走向规模化商用。随着企业对 AI 投入回归理性,成本效益(ROI)成为技术落地的关键考量。声网通过技术优化显著降低了对话式 AI 的使用成本,其语音对话服务价格低于 0.1 元/分钟,处于行业领先水平,大幅降低了企业的试错门槛。更为重要的是,声网在服务标准上正在从传统的 SLA(服务可用性)向业务价值指标转型。针对客服、教育、金融等不同垂直行业,声网开始协助客户建立基于“智能水平”的评判标准,如客户满意度、任务完成率、催收回款率等。这种深入业务场景、关注实际产出的服务模式,不仅增强了客户黏性,也使得声网能够通过支持 Function Call(工具调用)和 CRM 系统对接,帮助企业实现从简单的“信息问答”向复杂的“任务执行”转型,从而获取更高的商业价值。

典型客户:

Open AI、MiniMax、智谱、珞博智能、Soul

 

4. 入选厂商列表 

 

“智慧城市行业分析”公众号

在公众号“智慧城市行业分析”回复关键字“爱分析报告”,获取相关报告文件。

www.smartcity.team

为您推荐

发表回复