国家数据发展研究院与火山引擎《人工智能赋能可信数据空间发展研究报告》:AI 与可信数据空间形成双向赋能的技术循环, 构建“价值共创生态化、资源交互智能化、可信管控动态化”体系架构,详解汽车、跨境数据、医疗、辅助驾驶4大领域领域案例(附报告下载)

2026年2月,国家数据发展研究院联合火山引擎正式发布《人工智能赋能可信数据空间发展研究报告》。

7f10ae74d581a7e92e3a96fd9fb958d0

报告系统阐述了人工智能在可信数据空间建设中的关键赋能作用,全面分析国内外可信数据空间的发展现状和面临挑战,提出“价值共创生态化-资源交互智能化-可信管控动态化”的人工智能赋能可信数据空间发展内涵和体系架构。

报告结合多个典型场景案例,为人工智能推动可信数据空间从“合规底线”向“价值高线”跃升提供可借鉴的实践指引。

人工智能技术的引入使数据空间从可信共享进一步走向数智共生,在价值共创、资源交互与可信管控的各个层面形成新的协同格局。可信数据空间与人工智能两者之间形成相互依托、双向赋能的技术循环:一方面,可信数据空间为人工智能提供高质量、可验证的多源数据支撑,解决模型训练中数据来源分散、质量不均和隐私保护不足的问题;另一方面,人工智能以智能治理、语义理解、模型推理等手段反哺数据空间建设,提升其在安全管控、资源交互和价值创造方面的智能化水平。

在价值共创生态化方面,可信数据空间以价值工厂为组织载体,依托AI-Native数据开发套件、多模态大模型、大模型管理服务中台、智能体开发中台、大模型机密计算五大人工智能技术支柱,重构数据由资源向价值转化的生成逻辑。通过在统一规则与可信约束下组织多主体协同参与数据开发与利用,数据不再以静态资产形态存在,而是持续转化为面向场景的数据产品与服务,并在过程中实现权益可界定、收益可分配、责任可追溯。该机制贯通数据采集、加工、交易与应用等关键环节,有效破解数据开发利用中协同难、变现难和分配难等问题,推动数据价值在多主体协作中持续释放,为实体经济提供稳定的价值增量支撑。

在资源交互智能化方面,人工智能原生多模态数据湖、语义互操作智能引擎、智能推荐与匹配系统的引入使数据空间由被动连接走向主动理解与决策多模态数据湖通过统一的存储与管理层,将传统架构下不同模态的分散数据进行一体化承载,并重构“存储-计算”架构实现“数据与算力智能协同”,彻底打破数据模态壁垒,进而实现对多源异构数据进行统一表征与语义对齐,系统能够理解数据的内在含义及其潜在用途,并在此基础上对数据供需关系进行智能判断与动态匹配。由此,数据流通不再依赖人工配置或静态规则,而是根据业务上下文实现自适应的资源发现与交互优化,显著提升数据空间的资源配置效率与整体运行效能。

在可信管控动态化方面,利用人工智能驱动的智能体全面赋能动态权限管控、日常安全运营和流通合规监管,实现由静态规则向动态智能转变。基于多智能体架构,构建多样化的智能体应用支持安全合规工作开展:零信任智能体支持智能化数据分类分级,推荐数字合约条款构建“用户—数据—场景”模型并落实使用控制策略;数据合规智能体支持政策解读、合规评估和业务审批工作开展,通过比较实际业务流量和合规评估业务审批结论、使用控制策略,基于语义标签与数据分级标识,对异常调用、越权传输或违规利用进行识别;安全智能体以风险识别和处置响应为核心构建持续改进的体系化安全运营能力。

报告选取四大跨行业案例,验证了 AI 赋能可信数据空间的落地价值与实际成效,覆盖汽车、跨境数据、医疗、辅助驾驶等领域,核心成效均为平衡数据安全与价值释放,具体如下:

  • 端云协同驱动智能座舱升级:车企依托大模型机密计算实现车载数据全链路隐私保护,整合多源数据构建精准用户画像,提升智能座舱体验,同时吸引第三方开发者合规参与创新,激活生态。
  • 跨境数据网关破解多头监管难题:综合保税区构建跨境可信数据空间,部署数据网关兼容国内外监管规则,通过闭环管控与 “自证清白” 机制,实现跨境数据全生命周期可追溯,提升审批效率,为数据跨境流动提供可复制方案。
  • 赋能辅助驾驶模型性能升级:整合多模态数据湖技术重构智算链路,实现 CPU/GPU 异构算力协同调度,打破数据孤岛,降低存储成本至原来的 1/4,提升资源利用率,为辅助驾驶模型迭代提供数据支撑。
  • 赋能影像 AI 模型联合训练:医疗可信数据空间结合零信任智能体与隐私计算,实现多医院影像数据 “可用不可见” 的协同训练,标准化异构数据并提升模型诊断准确率,破解医疗数据孤岛与隐私合规难题。

未来人工智能将从安全防护、资源交互、要素供给三大维度深度驱动可信数据空间升级,推动数据要素流通与价值释放迈向新阶段:

  1. 安全防护智能化。构建动态自适应的主动防御体系,结合隐私计算技术,实现从事后补救到事前预防的转变,应对算法攻击、模型窃取等新兴风险。
  2. 资源交互智能化。通过跨域数据语义融合,打破行业边界,推动可信数据空间从行业应用平台演进为跨行业创新枢纽,催生新产业与商业模式。
  3. 要素供给智能化。AI 实现数据自动治理与质量提升,通过价值评估与动态定价优化数据配置,形成 “数据 – 算法 – 应用” 的价值闭环,推动国家数据基础设施升级。

总体而言,AI 与可信数据空间的深度融合,将成为完善国家数据基础制度、提升数字竞争力的重要引擎,为产业升级、社会治理与民生改善注入持续动力。

报告下载

“智慧城市行业分析”公众号

智慧城市行业分析”公众号,回复“人工智能赋能可信数据空间 “ 获取下载地址

报告摘要

序言:共创可信数据新生态

数字经济正以前所未有的速度重塑全球经济格局,而数据作为这一时代的核心生产要素,其价值已渗透到经济社会的每一个环节。从农业生产的精准调控到工业制造的智能升级,从金融服务的高效运转到公共服务的普惠延伸,数据的高效流通与深度应用成为驱动产业变革、提升治理效能、改善民生福祉的关键力量。随着数字技术与实体经济融合的不断加深,数据规模呈指数级增长,其跨域、跨行业、跨主体的流通需求日益迫切,数据要素市场化配置已成为衡量国家数字竞争力的核心指标,更是推动经济高质量发展的重要引擎。

然而, 数据要真正”供得出、 流得动、 用得好” , 必须解决”不愿共享、 不敢共享、 不会共享”的三个难题。在此背景下,可信数据空间应运而生。作为实现数据”可用不可见、可控可追溯”的新型基础设施,可信数据空间正成为破解数据孤岛、激活数据价值的战略支点。在数据安全与流通效率的双重诉求下,传统数据共享模式面临着权属界定模糊、安全合规风险高、价值分配不均等诸多挑战,而可信数据空间通过构建统一的信任机制、规范的数据治理规则和灵活的技术适配框架,为政府、企业、科研机构等多元主体提供了安全可控的数据流通利用环境,促进数据要素在不同场景下的高效协同,从而释放数据的乘数效应。

人工智能技术的发展,为可信数据空间的建设提供了新的驱动力。面对海量异构数据的治理难题、动态复杂的安全威胁以及多元主体的协同需求,传统技术手段已难以满足实际应用场景的要求。而人工智能凭借其跨模态理解、自主决策、协同优化等能力,正从价值共创的生态化构建、数据资源的智能化交互、可信管控的动态化平衡等多个维度,为可信数据空间注入新的活力。从多模态大模型打破数据壁垒,到安全智能体实现实时风险预警,再到低代码开发平台降低数据产品创新门槛,人工智能正在重新定义数据治理的范式,推动可信数据空间从”合规底线”向”价值高线”跃升,最终实现数据要素的安全流通与高效利用,为数字经济的可持续发展提供强大支撑。

目录

一、可信数据空间发展态势和挑战

  • 国际可信数据空间发展现状

  • 我国可信数据空间发展现状

  • 可信数据空间发展挑战

二、人工智能赋能可信数据空间发展内涵和体系架构

  • 发展内涵

  • 价值共创生态化

  • 资源交互智能化

  • 可信管控动态化

三、典型实践案例

  • 案例一:端云协同驱动智能座舱升级

  • 案例二:跨境数据网关破解多头监管难题

  • 案例三:赋能辅助驾驶模型性能升级

  • 案例四:赋能影像AI模型联合训练

四、人工智能驱动可信数据空间发展展望

报告正文

一、可信数据空间发展态势和挑战

国际可信数据空间发展现状

近年来,全球主要经济体及区域性组织积极推进数据空间战略布局,将其视为推动数据要素流通和释放数据价值的核心载体。

欧洲以完善的法律体系和数据治理规则为核心,推动数据空间建设走在全球前列。《欧洲数据战略》明确提出建设欧洲共同数据空间作为数字化转型的战略基石,通过基础设施与数据治理机制相结合,推动数据在健康、农业、制造等重点领域的共享与应用。欧盟陆续出台《数据治理法案》《数据法案》《数字服务法案》《数字市场法案》等法律文件,为推进数据空间建设提供统一的法律规则,并在文化遗产、旅游、交通和健康等细分领域发布专项政策文件,细化建设目标与实施路径。由欧盟资助的 GAIA-X 项目旨在构建一个符合欧洲标准和价值观的、可互操作的数据基础设施框架,对全球数据空间架构设计产生了深远影响。据国际数据空间协会(IDSA)统计,截至 2025 年 3 月,全球已形成约 190 个数据空间案例,其中欧洲占据主导地位。

美国依托市场活力与技术创新优势,形成以企业为主导的数据空间发展模式。美国政府通过发布行政命令和政策指南(如《联邦数据战略》)、倡导”开放数据”等方式,营造有利于数据流通和创新的政策环境。美国凭借其在云计算、人工智能、隐私增强技术等领域的全球领先优势,由大型科技公司(如 Google, Microsoft, Amazon)主导推动数据空间相关技术和服务的商业化落地, 强调技术集成与高性能, 在医疗、科研等特定领域通过行业联盟推动实用化协作生态。

日本在跟进国际趋势的同时,聚焦本国优势领域探索差异化路径,推动数据空间本地化实践落地。日本政府将数据空间视为实现”社会 5.0″和提升产业竞争力的关键,在《综合创新战略》中明确提出要构建跨行业的数据流通生态。其发展路径兼具欧洲的规则导向和美国的实用主义,特点在于高度重视特定垂直领域的深度应用,如专注于推动制造业供应链数据共享的”互联工业”倡议,以及旨在提升医疗研发效率的”医疗数据空间”。日本经济产业省(METI)等机构积极推动国内数据空间标准与国际标准(如 IDSA 参考架构)的对接,以促进跨境数据流通,并寻求在亚太地区数据合作中扮演领导者角色。

我国可信数据空间发展现状

我国自《关于构建数据基础制度更好发挥数据要素作用的意见》(”数据二十条”)和《可信数据空间发展行动计划(2024—2028 年)》发布以来,可信数据空间建设进入快速发展阶段,初步形成了从顶层设计、技术研发到应用落地的系统化推进格局。

在核心技术层面,技术创新体系加速构建。2024 年 12 月,国家发展改革委、国家数据局、工业和信息化部联合印发《国家数据基础设施建设指引》,明确将可信数据空间作为数据基础设施的重要技术路线。国内科研机构与龙头企业围绕数据使用环境、控制策略执行、使用存证、隐私计算、机密计算等关键技术持续攻关,初步实现了数据在采集、流通、使用、追溯等环节的全生命周期动态管控。可信数据空间逐步具备多源异构数据安全汇聚、跨域可信交换及合规共享能力,技术体系正从原型验证迈向工程化与规模化应用阶段,为国家数据基础设施体系提供了可落地的技术支撑。

在制度规则层面,标准体系逐渐完善。在国家数据局指导下,全国数据标准化技术委员会已启动多项可信数据空间相关标准研制工作,形成了”基础共性+关键技术+行业应用”三层架构的标准框架。已发布的《可信数据空间技术架构》《数字合约技术要求》《使用控制技术要求》及《技术能力评价规范》等 4 项关键技术标准,为空间的可信互操作与安全治理提供核心支撑。同时,围绕数据使用合规、主体责任划分、跨域数据流通等重点议题,配套制度与评估规范正加快建立。我国主导提出的 3 项可信数据空间国际标准提案获 ISO/IEC 正式立项,标志着我国在全球数据空间治理规则制定中实现从积极参与向引领主导的重要转变。

在应用生态层面,应用实践多点开花。2024 年 10 月,国家数据局开展数据基础设施先行先试,在 8 个城市部署可信数据空间建设项目。2025 年 7 月,国家数据局公布 2025 年可信数据空间创新发展试点名单, 共遴选 63 个项目, 覆盖城市、 行业、 企业三个维度。城市方面, 上海、 深圳等超大城市以”生态适配”为核心,打造城市级数据空间,支持超海量异构数据处理能力;温州、南昌等中小城市则以”产业赋能”为导向,深耕营销、医疗等特色领域,探索数据驱动转型的中小城市路径。行业方面,医疗、物流、装备制造、气象、卫星遥感等国计民生领域成为应用主力,依托可信数据空间实现跨主体数据协作。企业方面,各类主体积极探索数据产品开发与服务创新,推动数据要素市场化进程。

 

关键技术标准数:4个

部署可信数据空间建设城市:8个

遴选项目个数:63个

可信数据空间发展挑战

尽管取得了积极进展,可信数据空间建设仍面临多方面挑战。

01 数据融合能力不足

各领域数据类型差异显著,涵盖文本、图像、音频、视频、传感器信号等多模态形式,且在数据格式、语义定义、质量标准方面缺乏统一规范。传统的数据集成方法高度依赖人工映射与规则配置,处理海量异构数据时效率低下、成本高昂,且难以适应数据源的动态变化。这导致数据在空间内难以实现深度的、语义级的融合与互操作,制约了高质量数据产品的快速生成,成为阻碍数据空间规模化发展的瓶颈。

02 跨域流通合规复杂

数据在跨地域、跨行业、跨司法管辖区流动时,需要同时满足来源方、使用方以及途经各地的多重监管要求(如中国的数据出境安全评估、欧盟的 GDPR),这些法律制度存在差异且可能动态调整。当前缺乏高效、低成本的自动化合规审核机制与事后追溯机制,主要依靠静态规则配置,导致合规校验周期长、成本高、灵活性差,难以支撑大规模、高频次的数据流通业务需求,也增加了企业的合规风险与监管机构的执法难度。

03 安全防护压力增大

可信数据空间中的多方协同、动态开放特性对安全提出了更高要求。传统基于边界防护和静态权限的安全模型难以应对复杂多变的内部和外部威胁环境。面对日益隐蔽的数据爬取、权限滥用、模型逆向攻击等新型风险,存在未知攻击检测困难、异常行为识别滞后、动态权限调整刚性不足等问题。安全运营高度依赖专家经验,响应速度跟不上威胁演变的速度,使得数据空间面临持续性的安全挑战,影响参与主体的信任度。

04 价值释放效率偏低

当前,可信数据空间的建设重点仍集中在数据汇聚与安全流通,价值转化体系相对滞后。数据产品开发流程复杂,自动化与智能化水平不足,从数据发现、清洗、建模到服务封装周期较长,难以支撑高频次的数据服务需求。中小企业及非技术主体缺乏低门槛的开发工具,难以参与数据创新与服务供给,导致空间内数据利用率偏低。同时,数据价值评估、定价与收益分配机制尚未完善,激励体系缺乏透明性和动态性,供给方积极性不足。总体来看,可信数据空间在实现安全可信流通的基础上,还需进一步提升数据的可用性与可变现能力,构建高效、公平的价值释放体系。

二、人工智能赋能可信数据空间发展内涵和体系架构

发展内涵

可信数据空间作为人工智能的数据基座,旨在打通跨主体、跨行业、跨区域的数据壁垒,实现数据的可信流通与价值创造,并为各类智能模型的能力优化提供底层数据资源支持。然而,随着数据类型的多样化、治理要求的复杂化以及模型计算的智能化,传统依靠静态规则与人工配置的管理方式已难以适应新的数据生态。人工智能技术的引入,使数据空间从”可信共享”进一步走向”数智共生”,在价值共创、资源交互与可信管控的各个层面形成新的协同格局。

4973196df92c32b08a276d166067715b

在上述背景下,新型的人工智能与可信数据空间融合架构正在形成,如图 1 所示。

可信数据空间与人工智能两者之间形成相互依托、双向赋能的技术循环

一方面,可信数据空间为人工智能提供高质量、可验证的多源数据支撑,解决模型训练中数据来源分散、质量不均和隐私保护不足的问题;

另一方面,人工智能以智能治理、语义理解、模型推理等手段反哺数据空间建设,提升其在安全管控、资源交互和价值创造方面的智能化水平。

2.1 价值共创生态化

在价值共创层,可信数据空间以”价值工厂”为核心载体,支持多主体在规则约束下共同参与数据开发利用,推动数据资源向产品与服务转化并保障各方权益。如图 2 所示,依托五大人工智能技术支柱,这一生态实现高效运转:AI-Native 数据开发套件通过智能清洗、标注与特征提取,将实体场景数据转化为高质量数据集,筑牢数实融合的数据基础,契合国家”数据要素 ×”行动对数据加工提质的要求;多模态大模型打破异构数据壁垒,实现数据”会思考、能行动”的深度赋能;大模型管理服务中台聚合模型资源并精调行业垂直模型,让数据价值精准匹配实体需求;智能体开发中台提供低门槛开发能力,助推多主体参与数据服务创新;大模型机密计算则提供全链路隐私保护。这套技术体系打通数据采集、加工、交易、应用全链条,推动数据增值变现,为实体经济注入新动能。

9805b330de2b55ecd612428033aee7aa

1 AI-Native数据开发套件赋能数据智能化生产

在可信数据空间的整体架构中,价值共创层需要将源源不断的高质量数据开发为数据产品。因此,数据开发这一环节,实际上承担着把多源、异构、噪声较多的原始数据,转化为可被模型训练、推理和服务编排直接消费的标准化数据产品的职责,是价值共创链条的产品”车间”。但其面临着数据模态的多样性和处理的复杂性的挑战:一方面,数据规模呈爆发式增长,类型从结构化数据快速扩展到文本、图像、视频、传感器流等多模态数据;另一方面,业务需求迭代加快,新场景上线周期被不断压缩,调度逻辑越来越复杂,而底层计算和存储资源不可能无上限扩张。传统依靠人工编码、脚本堆叠和经验调度的数据开发模式,在交付效率、流程灵活性和质量保障方面逐渐暴露瓶颈,难以支撑可信数据空间对高频、高质量数据服务交付的要求,也难以匹配上层模型应用持续迭代的节奏。

AI-Native 数据开发套件可以被视为面向可信数据空间的数据生产基础设施升级。AI-Native 指的是数据开发体系从设计之初就嵌入智能算法、学习机制与自优化逻辑。它不是在传统流程上叠加外置的智能模块,而是让人工智能直接参与数据识别、治理、加工和调度,使数据空间具备”自感知、自决策、自演进”的特征。在可信数据空间的整体框架中,这一套件承担三方面核心作用:

01 智能生成与建构 人工智能模型通过对元数据、日志及历史任务的理解,自动识别不同数据源间的关联,生成最优的数据采集与处理路径,使原始数据在进入空间的同时即被智能加工与结构化。

02 基于主动元数据的动态资源调度 针对数据规模持续增长、数据传输链路复杂度提升及存算资源紧张等挑战,AI-Native数据开发套件通过主动元数据实现对资源状态的实时感知,并基于AI推断自动决策数据处理路径。系统能够持续采集存储负载、数据访问热度和任务队列等运行信号,预测后续资源需求,并据此调整数据管道的执行顺序与数据布局,例如将高频热数据优先迁移至高速介质、将低频数据自动归档至低成本存储,或对非紧急任务进行错峰调度,从而实现数据处理链路的持续优化,提高整体业务效率。

03 存算协同的内生治理与反馈优化 AI-Native套件在执行任务的同时记录调度效果与运行状态,结合主动元数据形成”任务表现-资源消耗-策略效果”的闭环反馈。系统根据反馈持续迭代调度策略,使数据治理逻辑、资源分配策略与处理链路动态优化。例如,在任务耗时、存储成本或访问延迟出现异常趋势时,系统能够自动触发策略微调或重构处理路径,实现数据产品质量和处理效率的长期稳定。

2 多模态大模型提升数据认知与决策能力

在可信数据空间的整体架构中,价值共创层不仅需要高质量的数据供给,还需要对数据进行深度理解与场景化认知,使数据能够直接支撑智能分析、推理判断和业务决策。因此,多模态数据理解能力承担着让数据能被高效地用起来的关键职责,其本质是把来自文本、语音、图像乃至传感器流的多源异构数据,转化为可被智能体、模型应用和业务系统理解的统一认知表达。然而,数据模态跨度大、语义对齐困难、场景理解复杂,使传统以单模态处理、人工标注和规则逻辑为主的方式难以支撑可信数据空间对深层次智能认知的要求,也难以支撑上层模型应用的迭代演进。

多模态大模型作为具备语言理解、语音交互与视觉理解等复合能力的新一代人工智能技术,不仅打通多类型数据之间的语义壁垒,还在与大模型管理服务中台和智能体开发中台协同的基础上,形成”数据融合—深度研判—场景落地”的连续认知链条, 从而构建起数据空间内的统一智能认知体系。在可信数据空间中,多模态大模型承担三方面核心作用:

01 统一理解与语义对齐 通过跨模态语义解析, 将文本、 图像、 语音等多源数据映射为一致的语义表示,解决模态间理解不一致的问题, 使数据能够被统一检索、 比对与推理, 为后续分析建立共同语义基础。

02 深度关联与综合研判 基于融合后的语义空间,系统可对不同来源、不同模态的数据进行关联分析,例如从政务文本中抽取政策要点,并结合图像识别的场景线索进行态势判断,形成可用于决策支持的综合分析结果。

03 生成式表达与场景落地 在完成理解与分析后,多模态大模型能够根据研判结果生成结构化的执行方案,并在低代码工具链的配合下快速落地为具体业务动作,实现从数据理解到智能决策的闭环。

通过上述嵌入式智能机制,可信数据空间的数据开发环节不再依赖人工脚本和单一规则,而是形成了基于主动元数据驱动的智能循环体系:”数据输入 – 人工智能解析与构建 – 动态调度与治理 – 结果反馈与策略优化”。在这一体系的支撑下,AI-Native 数据开发套件带来了两方面重要变化:一是显著提升了数据空间的响应能力与可扩展性。面对数据源的持续增加,系统能够基于实时元数据自动吸收新数据、判断其加工路径并优化数据传输链路,无需额外的人工适配;二是推动数据处理过程与人工智能能力的协同演化。人工智能不再等待固定流程输出的清洗结果,而是主动参与数据构建、标注与结构化处理,使可信数据空间存算链路具备可理解、可学习和可自我优化的特性。

在多模态大模型的基础上,数据智能体(DataAgent)进一步扩展了这一认知能力。DataAgent 能够理解业务目标、自主组织分析流程并交付洞察,让用户以自然语言开展数据分析与研究。在可信数据空间中,它在数据供给侧与数据消费侧之间构建起智能化的可信桥梁,降低数据使用门槛,使更多主体能够参与数据要素的消费、流通与共创。

目前,多模态大模型与 DataAgent 已在多元场景实现落地应用。城市治理与 AI+ 政务领域,政府可通过政务外网专线和可信计算等安全措施接入可信空间的专有 AI 云,依托空间内多模态大模型与 DataAgent 处理政务文本、民生诉求语音、政务服务图像等多源数据,高效赋能政策解读、民生工单派发、跨部门协同核验等场景,帮助 AI+ 政务领域降本增效。

3模型聚合与精调促进行业垂直智能优化

在可信数据空间的整体架构中,价值共创层通过将数据资源产品化与服务化,推动数据向各类模型应用提供价值。其中,大模型管理服务中台是支撑这一过程的关键产品形态。一方面,当前模型资源普遍存在分散、孤立的问题,政府、企业、科研机构各自开发模型但缺乏统一管理与协同机制,难以形成共享共用的能力体系;另一方面,通用大模型要真正服务行业场景,还需要在可信环境中结合本地数据进行持续优化与校准。若缺少统一的平台进行聚合、编排与精调,数据价值难以有效传导至模型端,模型能力也难以规模化应用。

围绕上述痛点,大模型管理服务中台在价值共创层中主要承担三方面核心作用:

01 模型资源的统一汇聚与服务化发布 将分散的大模型及相关能力纳入统一目录,进行规范化描述和统一接入,形成可检索、可组合、可复用的模型池,对外以标准化服务形式提供调用入口,减少重复建设和对接成本。

02 面向行业场景的模型精调与配置 依托可信数据空间内经过治理的数据,中台支持在合规前提下对模型进行有针对性的优化与微调,将行业知识、业务能力沉淀到模型能力中,形成贴合具体场景的垂直模型应用,并通过参数配置、策略调整等方式适配不同业务方的使用需求。

03 模型全生命周期的治理与运营支撑 通过统一的管理与监测机制,对模型接入、使用范围、调用策略、评估反馈等进行全过程管理,记录模型使用行为和效果,支撑后续的持续优化和责任界定,确保模型能力在可信数据空间内的长期稳定供给。

在大模型管理服务中台的支撑下,价值共创层得以打通”数据—模型—应用”之间的传导链条:一方面,数据资源通过平台更高效地输送到模型侧,促进通用模型向行业垂直模型的持续演进;另一方面,模型能力经由中台以产品化、服务化的方式向外输出,使政府、企业和其他主体能够在较低门槛下获取适配自身场景的智能服务。目前,此类中台已在智慧政务、企业服务、公共治理等领域开展实践应用,逐步成为可信数据空间中承载智能能力聚合、管理与场景落地的重要支撑产品。

在可信数据空间的建设与运营过程中,各类主体在开展智能应用创新时往往面临两个突出矛盾:一是应用开发门槛较高,需要具备对模型、数据和业务流程的综合理解;二是跨主体整合资源和能力的难度较大,导致数据要素难以顺畅转化为可复用的智能服务。 传统的开发方式依赖较强的技术能力和较长的建设周期,在面对多场景、多需求的快速创新要求时往往难以应对。

4 低门槛智能体开发推动数据服务创新生态

智能体开发中台作为价值共创层的关键产品形态,旨在为政府、企业和科研机构等多元主体提供一个可快速构建、灵活组合和持续迭代的智能应用生产环境。通过低代码化、组件化与可视化方式,平台让更多参与主体能够以更低的成本、更高的效率完成智能体构建。在价值共创层中,该平台主要承担三方面核心作用:

01 降低应用开发门槛,提升创新参与度 平台提供标准化的组件库和可视化流程编排工具,使用户能够通过拖拽与配置完成应用逻辑设计,以实现从数据接入、处理到结果呈现的全过程,大幅提升智能应用开发的普适性和易用性。

02 促进能力复用与灵活组合,丰富数据服务形态 平台支持对数据能力、模型能力和业务规则进行组合式调用,模型能力以服务化形式开放,使其能够被快速嵌入到不同业务流程中,推动数据价值以更便捷的方式向各类服务形态延伸。

03 支撑智能体的全生命周期管理,实现持续迭代优化 平台对智能体从构建、调试、发布到运行监测提供一体化支持,使应用能够在不断变化的业务需求中持续优化。通过统一的管理机制,便于不同主体在同一环境中协作开发并复用已有能力,形成更高效的创新循环。

在智能体开发中台的支撑下,价值共创层形成了”低门槛开发—能力组合—快速创新”的整体链条,使数据价值可以更高效地转化为各类场景化服务。一方面,使各参与方可以在统一的平台中参与智能应用构建,扩大了数据要素开发与使用的主体范围;另一方面,推动不同部门和机构之间形成更丰富的协同创新模式,逐步构建起可信数据空间中的多主体创新生态。

5 大模型机密计算支撑全链路隐私保护体系构建

在可信数据空间的价值共创层中,大模型训练与推理是数据价值释放的关键环节,也是最容易触及隐私与安全边界的部分。不同机构、行业和地区的数据在此汇聚参与模型优化,数据敏感性高、协同链路长、参与主体多。若缺乏统一的安全计算框架,不仅数据泄露风险陡增,还会破坏数据空间的信任机制,使跨域协作难以持续。

大模型机密计算不仅仅是防止数据泄露的安全手段,更是可信数据空间信任体系的核心支撑。它使安全数据计算从外围约束变为内部能力,让隐私保护、合规管理与模型计算形成一体化的运行模式。从体系演进角度看, 机密计算平台还实现了价值共创层与可信管控层的双向联动:向下, 它依托可信管控层的身份认证、访问控制和数据分级策略,实现对安全策略的动态继承与强化;向上,它为大模型训练与推理提供可信算力环境,使生成、优化、调用等全过程都在密态条件下完成。这种双向闭环让数据空间重塑了从数据资源到数据产品的安全可信加工流程, 为未来跨行业、 跨平台的数据要素流通建立了可验证、 可推广的安全范式,有力支撑了数据要素的合规流通与价值释放。

大模型机密计算平台正是价值共创层的安全底座,它贯穿数据生产、流通与模型使用的全链路,为可信、可用、可控的数据利用提供技术支撑。在可信数据空间整体架构中,该平台承担三方面作用:

01 大模型机密计算平台整合隐私计算技术以及 GPU&CPU 的可信执行环境(TEE)技术, 构建端到端的密态计算环境, 致力于解决高敏感数据在多方协同中的安全风险。 平台依据数据分类分级制度,对不同敏感级别的数据实施差异化加密策略,并通过数据沙箱实现严格隔离。它支持在 GPU 可信执行环境对数据进行密态模型训推,确保数据在传输、存储和处理全程处于可用但不可见的状态。同时,也可支持来自不同行业或地区的数据可以在不出域、不暴露的前提下协同参与模型训练与推理,真正实现跨域数据的安全使用。

02 支撑动态可信的安全治理机制。 平台遵循”零信任”架构,对每次访问、调用与任务调度进行实时验证和行为分析;依据数据分类分级规则, 自动匹配加密级别与计算环境, 形成差异化保护。系统可在发现风险行为时自动阻断任务、记录溯源,并通过数据沙箱隔离潜在异常节点。这种动态防护机制使模型计算与数据治理深度融合,从而实现从被动防护到主动防御的转变。

03 完善合规与责任可追溯体系。 机密计算平台与可信数据空间的溯源与审计机制协同运行,通过区块链或可信日志记录关键操作轨迹,形成完整的责任链条。同时,平台引入数据贡献评估与价值分配模块,对参与模型训练的各方按照数据质量和贡献度进行量化评估,推动数据要素价值的透明化与可计量化,为后续合规监管和事后审计提供依据。

2.2 资源交互智能化

在资源交互层,可信数据空间承载数据接入、发布、发现、转接和交付的全过程。在传统机制下,跨机构、跨领域的数据流通往往受制于语义差异与匹配低效。如图 3 所示,人工智能通过人工智能原生多模态数据湖、语义互操作智能引擎、智能推荐与匹配系统,为这一层注入了”理解”和”决策”的能力。语义互操作智能引擎基于自然语言理解与知识图谱技术,对不同来源的数据进行语义抽取与结构统一,使系统能够理解数据的含义与用途;多模态数据湖融合结构化与非结构化信息,为模型应用提供统一标准化支撑;智能推荐与匹配系统利用历史记录与上下文语义,自动判断数据供需关系并生成最优数据匹配策略。这使数据空间具备统一高效的资源交互能力并提升数据流通效率。

在可信数据空间的资源交互层中,数据的流通与计算效率直接决定了上层数据产品的生产效率和智能模型的质量与应用的响应速度。然而,随着多源异构数据规模的持续膨胀,数据形态从结构化记录扩展到文本、图像、视频、音频、时序信号等多模态形式,传统架构在处理此类复杂数据时往往面临三个突出问题:格式分散、流程割裂、算力利用率低。这些问题使数据难以被统一管理与调度,也使模型训练与应用部署陷入了数据易得但可用性不足的困境。

1 人工智能原生多模态数据湖重构智算链路

人工智能原生多模态数据湖技术将人工智能直接嵌入数据湖的存储、管理、计算和检索流程,实现数据资源与算力的深度协同与智能交互。与传统以被动存储形式为主的数据湖不同,它通过智能索引、特征抽取和语义理解,使数据湖本身具备理解数据的能力,从而成为可信数据空间中连接数据资源与智算能力的关键枢纽。在体系功能上,它发挥三方面核心作用:

01 多源数据统一承载与管理 人工智能原生多模态数据湖技术在存储管理侧采用统一元数据体系,实现对结构化、半结构化与非结构化数据的统一化承载。通过引入嵌入向量索引与语义标签机制,不同模态的数据可以在共享语义空间中实现协同检索与权限控制,从根本上解决了传统架构中多源数据格式不同造成的隔离问题。

02 异构算力与智能调度融合 在计算侧,数据湖融合 CPU+GPU 异构计算架构,并实现并行工作流的处理模式。可根据任务类型与资源负载自动生成相应执行计划,实现算力在不同任务间的自适应分配。

03 多层检索与快速响应 在检索侧,系统同时支持低成本离线分析与高性能在线查询。人工智能算法可在查询阶段预测最优搜索路径,大幅提升多模态检索效率;同时,语义向量检索使跨模态信息能够按语义关联进行匹配,为上层模型提供即时、上下文相关的数据调用能力。

上述机制使得人工智能原生多模态数据湖不仅在技术上提高了数据管理效率,更在体系上实现了可信数据空间中”数据接入—数据发布—数据发现—数据转换—数据交付”的闭环联通。数据在湖中统一管理、在计算层被动态调度、在模型层被智能消费,形成了从感知到推理再到决策的完整智算链路。

从应用角度看,其价值已在多个典型场景中得到体现:在自动驾驶场景中,车载传感器、路侧监控与地图数据可通过数据湖实现统一管理与协同计算,使模型迭代周期显著缩短;在智慧城市治理中,多模态数据湖融合政务文本、视频监控和语音诉求信息,为综合决策提供实时、全景式支撑。更重要的是,人工智能原生多模态数据湖使可信数据空间具备了动态优化的基础条件:数据湖不再只是静态资源库,而成为动态学习体,能够在持续的数据流通中不断优化索引结构与算力配置。这种自学习、自调度的特性,使得可信数据空间为资源交互与供需匹配提供了坚实基础与核心能力。

2 语义互操作智能引擎促进跨域语义互通

在可信数据空间的资源交互层中,数据和服务的高效流通不仅依赖于网络连通,还取决于语义互通能力。随着参与主体的增多和行业类型的多样化,不同行业、不同机构在数据命名、字段定义、接口协议和业务语境上存在显著差异。金融领域的”客户号”、交通领域的”车辆标识”、医疗领域的”患者 ID”在各自体系中定义明确,却难以在跨系统调用中互认,导致资源检索偏差、任务耦合度低、协作效率受限。传统依赖人工维护规则库或手工映射表的方式,不仅成本高、更新慢,而且难以适应可信数据空间中数据资源持续增长与动态变化的环境。

语义互操作智能引擎是资源交互层中连接人工智能原生多模态数据湖和智能推荐与匹配系统的中枢组件,通过知识图谱和语义对齐等算法的结合,实现跨系统语义的自动识别、统一映射和智能演化。与传统静态规则不同,该引擎具备自学习、自更新能力,能够让不同来源的数据在共享语义框架下被一致理解与调用。在可信数据空间整体架构中,该引擎承担三方面核心作用:

01 构建多源语义统一模型 引擎基于大语言模型的语义理解能力,自动解析各行业数据目录、接口文档和元数据描述,抽取核心概念并建立知识图谱,通过语义嵌入与相似度计算,完成概念对齐和关系映射,从而形成统一、可计算的语义层。这使数据空间中的不同数据源、服务接口和业务术语能够在逻辑层面互联互通。

02 实现数据任务语义匹配 当某一主体发起数据调用时,系统可自动识别目标语义并进行匹配。例如,当金融机构的数据治理系统调用医疗系统数据时,引擎能够自动识别”客户号”与”患者 ID”的语义等价关系,自动完成映射与转换,从而实现任务级的无缝协作。

03 实现引擎持续校正优化 与传统方案的集中式规则管理不同,语义互操作智能引擎以插件或微服务形式嵌入可信数据空间的各节点中,在数据注册、服务发布和模型训练等环节实时生效。系统通过持续采集调用日志与反馈数据,不断校正语义映射关系。

在实际应用中,该引擎已在多个领域验证其落地价值:例如在政务领域,该引擎被用于打通部门间信息壁垒,实现”居民身份证号”与”社保账户”等核心标识的自动语义映射,显著提升跨部门业务核验效率;在工业互联网领域,它支持设备参数、生产日志与运维记录的语义一致化,为跨企业供应链协同和设备健康预测提供语义支撑。

从体系意义上看,语义互操作智能引擎使可信数据空间从数据互联迈向语义互联,为跨域协同提供了统一的语义底座。它既是资源交互层实现智能调度与精准供需匹配的前提条件,也是可信数据空间走向数据共享与模型协同的关键环节。

3 智能推荐与匹配系统实现数据供需精准对接

在可信数据空间的资源交互层中,随着接入主体的持续增加与数据类型的快速扩展,数据供需两端的规模和复杂度都在显著提升。不同机构、行业和地区产生的数据在格式、语义、质量标准和访问权限上存在差异,导致数据资源虽汇聚于可信数据空间,却难以被高效流通。需求方往往需要耗费大量时间在庞杂目录中检索、比对与筛选;供给方则因缺乏精准推送与匹配机制,导致高质量数据资产长期闲置、利用率低。

智能推荐与匹配系统成为实现可信数据空间数据高效流通的关键机制。该系统基于语义互操作智能引擎所构建的统一语义层,结合自然语言理解、知识图谱与强化学习等人工智能技术,对供需双方的数据特征、语义描述与历史交互行为进行建模与动态学习,从而实现数据资源的自动发现、精准匹配与智能推荐。在整体架构中,该系统承担三方面核心作用:

01 构建数据资源画像与供需知识图谱 系统通过自动解析空间内的各类数据目录、元数据与服务描述文件,提取数据类型、更新频率、来源可信度、应用领域等特征,形成可计算的数据画像。同时,将需求方的查询意图与权限要求建模为需求画像,在语义层上实现供需图谱的关联与映射,为后续的智能推荐提供结构化支撑。

02 实现基于语义与偏好的动态匹配机制 当用户发起数据检索或调用时,系统可根据其语义描述、历史偏好及上下文场景,自动定位最相关的数据资源。例如,在城市治理领域,系统可根据不同部门的治理主题和数据调用习惯,自动匹配最适用的交通流量、环境监测或民意反馈数据集,实现精准的数据复用与协同共享。

03 实现自主运行与持续优化闭环 智能推荐与匹配系统深度嵌入可信数据空间的资源注册、访问授权与调用流程中,推荐结果与匹配反馈会被自动记录,并反向用于模型训练与参数更新,形成自学习闭环。这一机制使系统能够随数据资源规模、语义体系和使用需求的变化持续优化推荐效果,保持动态适应性。通过这一体系,可信数据空间的资源流通模式从人工搜索与被动调用转向智能推荐与主动供给,数据在空间内部得以根据价值、质量和时效性实现精准流动与最优配置。

智能推荐与匹配系统有望在多种实际应用中体现其价值。例如,在政务数据空间中,系统可帮助不同部门自动识别相似或可复用的数据资源,减少重复建设;在产业数据空间中,企业可通过语义化检索快速找到具备同类设备、场景或指标体系的数据集,支撑模型训练与决策分析;在科研与公共服务领域,研究机构和数据平台可依托系统推荐自动发现高质量公共数据源,提升开放数据利用率。

从体系角度看,智能推荐与匹配系统构成了可信数据空间实现数据流动智能化的关键枢纽。它承接语义互操作引擎提供的语义基础,驱动上层价值共创机制的协同运行,使数据要素在可信、安全的前提下实现可发现、可调用、可复用,推动可信数据空间从静态聚合向动态优化演进。

2.3 可信管控动态化

在可信管控层,可信数据空间承担数据全生命周期的安全与合规管理。通过全要素接入认证、全过程动态管控、全场景存证溯源等功能,确保数据来源可信、行为可控、流向可追。这一层的建设直接关系到人工智能训练数据的安全性与可用性,是模型应用等数据业务可信运行的根基。人工智能技术的加入,使管控体系从静态规则走向动态智能。如图 4 所示,零信任智能体结合模式识别技术实现接入行为的实时验证;安全智能体以风险识别和处置响应为核心构建持续改进的体系化安全运营能力;智能合规审计与动态追溯引擎自动解析法规条款并生成执行策略,通过知识规则与数据分析结合,实现对数据操作行为的持续监测、违规预警与责任溯源。这些能力推动可信数据空间为人工智能提供”端到端秘态运算”的数据环境,而人工智能反过来强化了数据空间的风险识别、合规审计与安全决策能力。

1a5ea21bb306c3dae16efae40c461fea

1 零信任智能体赋能数据分级防护和动态管控

在可信数据空间的可信管控层中,安全与效率的平衡始终是核心挑战。传统的数据安全体系多依赖静态规则与集中认证机制,在面对多模态、跨域、动态流通的数据环境时逐渐失效。随着空间规模扩大,数据类型复杂化、主体数量增加、使用场景多样化,静态规则库与人工核验方式已无法适应实时变化的安全风险,导致权限调整滞后、敏感识别不准、流通效率受限。这一问题不仅制约了数据要素的安全利用,也成为可信数据空间规模化发展的障碍。

零信任智能体的引入为可信数据空间建立起一种动态信任与智能管控并行的安全模式。其核心理念是”永不默认信任、 持续身份验证、 最小必要访问”。 与传统安全体系不同, 零信任智能体不是静态的访问控制工具,而是一个基于人工智能的自学习安全体,能够在数据分级、访问控制和行为监测等环节实现智能感知与动态决策。在可信数据空间架构中,零信任智能体承担三方面核心功能:

01 智能识别与自动分级 针对多模态数据难以人工判定敏感度的问题,智能体综合利用自然语言处理、计算机视觉与语音识别等模型,对文本、图像、音频等多类型数据进行语义层面的自动识别与分类。系统根据内容特征、来源可信度及流通范围等维度生成敏感度评分,实现数据的自动分类与动态分级。

02 动态授权与风险自适应 零信任智能体通过解析数字合约条款与访问策略,构建”用户—数据—场景”三维风险模型。利用强化学习算法持续评估访问行为与环境安全状态,系统可在发现风险上升或异常行为(如非办公时段的高频调用)时自动收紧权限,在安全环境中则适度放宽。由此形成的动态权限管理机制,使安全策略随情境自适应调整,既保障数据安全,又避免过度防护影响数据流通。

03 持续验证与行为感知 智能体通过对历史操作、行为路径和访问日志的持续学习,建立用户与数据交互的模型,实现异常检测与风险预测。当检测到越权访问或潜在攻击特征时,系统可自动触发阻断与告警,并将新发现的风险模式回馈至安全策略模型中,形成安全自进化闭环。

从体系意义上看,零信任智能体的引入,使可信数据空间的安全防护模式从静态规则约束转向动态感知防御,实现了安全与流通的协同共进。它不仅降低了人工治理成本,也为数据空间提供了可持续进化的安全能力。随着模型识别能力和策略优化机制的持续演进,零信任智能体有望成为未来可信数据空间的核心安全基座。

在实际应用中,零信任智能体已在多个领域开展探索:在金融与政务数据平台中,它能够在跨域共享过程中对敏感数据实时分级与风险打分;医疗与社会保障场景中,它可根据数据内容自动判断敏感级别,动态调整访问权限,使医疗机构之间的数据协作既合规又高效。

从体系意义上看,零信任智能体的引入,使可信数据空间的安全防护模式从静态规则约束转向动态感知防御,实现了安全与流通的协同共进。它不仅降低了人工治理成本,也为数据空间提供了可持续进化的安全能力。随着模型识别能力和策略优化机制的持续演进,零信任智能体有望成为未来可信数据空间的核心安全基座。

在实际应用中,零信任智能体已在多个领域开展探索:在金融与政务数据平台中,它能够在跨域共享过程中对敏感数据实时分级与风险打分;医疗与社会保障场景中,它可根据数据内容自动判断敏感级别,动态调整访问权限,使医疗机构之间的数据协作既合规又高效。

2 安全智能体支撑自动化安全运营体系构建

在可信数据空间的可信管控层中,随着数据流通规模的扩大与威胁环境的复杂化,传统安全运营体系逐渐难以为继。面对多模态数据、海量日志与多维流量信息,人工分析师既难以及时识别潜在威胁,又容易因信息过载产生误判与漏判,导致攻击行为滞后发现、响应延迟、风险外溢。安全运营体系的瓶颈正从检测能力不足转向响应效率不够。

安全智能体正是在此背景下形成的可信管控层核心技术之一。它以人工智能模型、强化学习与知识推理能力,形成一种具备记忆、推理、任务规划与工具调用能力的智能安全执行单元。与传统被动式安全防护不同,安全智能体是面向运行过程的主动防御者,能够持续感知数据空间的运行状态、实时评估安全风险,并根据策略模型自主决策和执行。在可信数据空间的运行架构中,安全智能体主要承担三方面作用:

01 智能感知与风险识别 安全智能体通过接入空间内的日志管理系统、访问控制模块和多模态监测节点,持续收集数据访问、任务调度等行为信息。依托人工智能模型的语义理解能力,系统能够自动识别异常行为模式,如越权访问、异常高频调用或敏感数据泄露迹象,实现从静态检测到动态感知的转变。

02 联动处置与自主响应 安全智能体与零信任智能体协同工作:当零信任体系在前端完成访问验证后,安全智能体负责监测运行过程中的安全状态,并在检测到威胁时触发联动响应机制。系统可依据风险等级自动执行多级防护措施,包括账户锁定、隔离节点、流量阻断或任务回滚等,大幅缩短人工干预时间。

03 安全运营与自主优化 在长期运行中,安全智能体可将历史事件、处置结果与风险演化特征纳入学习样本,利用强化学习等人工智能机制持续优化威胁判断与响应策略。这样,系统的防护水平能够随运行经验不断提高,形成可持续演化的安全运营体系。与此同时,安全智能体将关键信息反馈至智能合规审计与追溯引擎,为事后监管和规则优化提供数据依据,推动安全治理与合规管理的一体化。

在实际落地方面,安全智能体已在多个领域的可信数据空间建设中开展示范:在金融数据空间中,智能体结合交易日志和用户行为建模,实现欺诈检测与风险拦截,显著降低人工复核量;在政务与公共数据空间中,智能体可实时监测跨部门数据调用与接口访问情况,自动识别越权操作;在能源与交通领域,安全智能体通过多模态感知节点识别关键设施异常通信,实现对基础设施的动态防护。

从体系层面看,安全智能体是可信管控层的中枢环节。向下,它与零信任智能体协同,实现数据访问前的动态授权与防御;向上,它为智能合规审计引擎提供运行态风险证据与行为记录,支撑后续溯源与问责。这种架构协同使可信数据空间的安全治理体系具备了前瞻防御、实时运营与事后可证的全链路能力。安全智能体的引入,不仅让安全运营从人工响应迈向智能自治,更让安全从外部约束转化为可信数据空间自身的内生运行能力。

3 智能合规审计与动态追溯引擎提升合规监管水平

在可信数据空间的可信管控层中,随着数据跨域流通与多方协作的深入,合规管理已成为确保数据要素安全流动和价值实现的核心前提。数据从采集、共享、加工到交易、应用,涉及的环节多、参与主体广、法规要求复杂且变化频繁。传统依赖人工抽检和静态规则库的方式,难以跟上政策调整与场景变化的速度,常出现规则滞后、监管盲区和责任模糊等问题,制约了可信数据空间的规范化与规模化发展。

智能合规审计与动态追溯引擎则是面向这一难题的有效解决方案。它位于可信管控层的最后,与零信任智能体和安全智能体形成完整闭环:零信任智能体负责前置防护与访问控制;安全智能体实现运行态风险监测与动态处置;智能合规审计引擎则在此基础上负责规则约束的智能解析与全链路追溯,构建空间级的智能合规保障体系。在架构中,该引擎承担三方面关键功能:

01 智能规则解析与动态策略生成 依托自然语言处理与人工智能模型的语义理解能力,系统能够自动读取、解析新出台的法律法规、行业标准及数据治理文件,识别其中的约束条件与管控要求。通过知识图谱构建合规知识网络,系统可自动关联新旧规则、识别潜在冲突并生成可执行的策略模板,从而实现从政策文本到可计算规则的动态转化。

02 流通链路全程审计与实时监控 引擎嵌入数据空间的流通过程,与数据注册、访问、调用和共享模块联动,实现全过程的实时合规审计。系统基于语义标签与数据分级标识监测数据使用路径,对异常调用、越权传输或违规再利用行为进行实时告警和拦截。

03 可追溯验证机制与责任认定 当发生违规或风险事件时,智能合规审计与动态追溯引擎可追踪数据流转路径与操作链条,自动识别责任主体和环节。所有操作日志可生成可验证的数字证据,为后续问责、争议仲裁和监管评估提供依据。

从体系演进的角度看,智能合规审计与动态追溯引擎的引入,使可信数据空间的治理逻辑从静态管控迈向动态感知与主动合规。它不仅解决了监管滞后问题,更让合规成为空间运行过程中的内生能力:向前,它将审计反馈与策略更新结果同步至零信任与安全智能体,推动安全策略迭代优化;向后,它将行为记录和违规分析结果输出至监管接口与行业标准库,为制度完善提供数据支撑。这种闭环式合规治理模式为未来跨行业、跨区域数据要素流通提供了可验证、可推广的监管范式。

[闭环治理双向链路]

  • 向前链路:审计反馈+策略更新结果 → 零信任与安全智能体 → 推动安全策略迭代优化

  • 向后链路:行为记录+违规分析结果 → 监管接口与行业标准库 → 为制度完善提供数据支撑

  • 跨境数据服务场景:自动解析监管要求、对数据访问和处理操作实时比对与评分、依据不同国家/地区隐私与数据出境政策自动匹配合规规则、对跨境传输链路全程监控与溯源

    • 为监管机构与企业建立透明的数据合规基础

  • 金融合规平台:自动解析监管要求、对数据访问和处理操作进行实时比对与评分

    • 帮助企业在多重法规下高效履行合规义务

在实际应用中,该引擎已在多个典型领域展现出落地潜力:在跨境数据服务场景中,系统能够根据不同国家与地区的隐私与数据出境政策自动匹配合规规则,对跨境传输链路进行全程监控与溯源,为监管机构与企业建立透明的数据合规基础;在金融合规平台中,系统可自动解析监管要求,对数据访问和处理操作进行实时比对与评分,帮助企业在多重法规下高效履行合规义务。

三、典型实践案例

案例1:端云协同驱动智能座舱升级

6e855c3b9019c9c0f36542995ab85d9801 需求分析

某车企为提升车载智能应用体验,需实时采集车端语音、环境信息、车辆运行数据,并整合运营商轨迹数据和互联网用户行为等多方数据,以实现精准的用户偏好分析与场景化推荐。然而,该过程面临严峻挑战:为提升开发效率需引入第三方开发者,且受车端算力限制,大量计算需要在云端完成,这些数据包含大量个人敏感信息,如何在复杂的多方协作与云端处理中确保数据安全与用户信任,成为亟待解决的核心问题。

02 解决方案

针对车端算力受限、第三方协作复杂及数据安全风险并存的问题,该车企基于人工智能融合可信数据空间总体架构构建了一套端云互信、分层防护、智能流通的一体化解决方案,实现了车载数据从采集、传输到联合建模的全链路可信运行。系统首先依托大模型机密计算平台,为车载人工智能智能助手提供了覆盖数据从端侧采集到云侧推理全链路的隐私保护。车辆语音、轨迹、环境等数据经接入认证后加密上传,仅在安全计算环境中进行分析与建模,平台本身不可访问明文数据。与此同时,系统通过记录数据流转日志并固化关键操作,确保数据使用过程可追溯、可核验。在此基础上,企业将轨迹数据、车辆状态数据及用户行为数据进行统一管理和关联分析,使不同来源的数据能够在安全前提下协同计算,支撑个性化出行服务和场景化推荐的开发与迭代。

应用场景:

  • 生活服务推荐:通过结合车辆行为数据与用户上网行为数据,完善用户画像,可以根据车主的位置、出行习惯和偏好,推荐附近的餐厅、加油站、停车场等生活服务场所,并提供在线预订服务。同时,家中的智能设备也可以根据车主的需求,提前预定电影票、餐厅座位等。

  • 二手车线索:通过分析车辆历史数据,例如之前经常使用的车辆突然闲置较长时间,可以标记出哪些车辆可能有出售的可能。

  • 网约车识别:通过对车辆的实际使用规律分析,发现疑似营运车辆,并及时通知保险公司介入调查。

03 应用成效

方案实施后,车企在可信数据空间中实现了智能座舱和车载助手的安全落地。通过机密计算平台,数据在云端得以安全分析和建模,确保隐私不外泄;同时,多源数据协同使用户画像更加精准,服务响应速度明显提升。

用户可获得更具场景感知的智能体验,例如根据驾驶状态自动推荐音乐、调整照明或规划行程。企业方面,数据流转合规透明,第三方开发者可在可信环境中参与创新开发,显著提升了平台生态活跃度。实践表明,该模式有效平衡了数据安全与业务创新,为智能座舱升级和车联网可信生态建设提供了可借鉴的路径。

案例2:跨境数据网关破解多头监管难题

e5b858e8c49469760e4204d9ff35459d01 需求分析

某地综合保税区在推动科技创新与国际合作过程中,积极探索数据跨境便利化政策以支持相关业务发展,但在实际推进中面临多重挑战:企业不清晰如何合规开展数据跨境业务,尤其在人工智能模型训练、数据出境等场景中缺乏明确指引;网信部门缺乏持续有效的监管手段,难以对已获批数据流动实施动态管控;同时,也难以获得境外监管机构的信任与认可。为解决上述问题,某地综合保税区联合数据局推动模式创新,构建跨境可信数据空间,部署”数据网关”,系统化打通政策与技术堵点。

02 解决方案

跨境可信数据空间具备应对多法域复杂监管要求的能力。不同于普通数据空间通常仅服务于单一司法管辖区, 该空间需同时兼容国内《网络安全法》《数据安全法》《个人信息保护法》及《数据出境安全评估办法》等法规,并适配欧盟 GDPR、美国加州 CCPA 等国际规则。该空间通过”自证清白”机制,以运营方与使用方职责分离为基础,结合技术手段实现跨境事实透明、行为可追溯,为企业与监管部门建立信任桥梁。

在空间中部署的 “数据网关”, 构建闭环管控机制。 通过逻辑隔离的可信域, 对数据跨境实施全生命周期管理。在域内,借助可信管控平台开展数据接入审核与合规校验;在跨境传输环节,通过独立审查网关实施”申报—审核—放行”流程,确保申报内容与实际数据一致,并通过区块链存证与日志记录实现全程可追溯。系统还集成”数据出境安全评估”服务,构建企业、咨询机构与监管部门之间的协同机制。该机制整合政策解读与风险评估工具,帮助企业快速识别数据类型、选择合规路径,并为提供事中事后核查依据,从而有效降低企业合规成本。

针对人工智能全球化发展中的模型跨境合规难题,该空间构建了可信人工智能训练环境,利用机密计算实现数据”端到端秘态运算”的训练模式,并生成训练数据关联记录,使监管部门能够基于数据合规性间接评估模型出境风险,推动人工智能模型跨境从”无序”走向”可控”。

03 应用成效

通过建设跨境可信数据空间并部署数据网关,某地综合保税区系统化构建了”监管互信基础、闭环管理机制、出境安全评估支撑、人工智能监管适配”四大核心能力,在满足跨国监管合规要求的同时,为企业提供了高效、安全的数据跨境通道,显著提升了审批效率与合规透明度。该模式为数据要素在全球范围内的有序流动与价值释放提供了可复制、可推广的系统方案,也为园区和地方、国际跨境数据管理标准的制定提供了有益经验。

9c38ee0edb277898ea06011c39a8ac80

案例3:赋能辅助驾驶模型性能升级

c032958814bff5b9d8b738ed3610735901 需求分析

随着辅助驾驶技术向高阶演进,车企厂商的车辆传感器数据、城市交通部门的路侧设备数据以及地图服务商的地图与导航数据等多源异构数据呈爆发式增长。然而,传统技术架构面临一系列痛点:一是数据多源丰富性与异构计算效率存在矛盾,多源数据需跨 CPU 与 GPU 协同处理,但现有架构无法在单一工作流中同时调用两类资源,导致 PB 级数据处理耗时数天,严重拖慢模型迭代节奏;二是城市算力与企业算力资源调度低效,在数据自动标注过程中 GPU 无法并发,资源利用率偏低,传统架构下单卡 GPU 一次仅能支持一个标注模型,造成资源长期闲置;三是存储经济性与管理成本失衡,采用传统存储格式时,每次增加列推理标注列都需重新读取并重建全量数据集,带来高昂的存储与人力成本。

02 解决方案

为解决上述问题,可信数据空间整合了多模态数据湖技术,重构智算链路:首先,构建统一的数据基座并强化数据安全,通过汇聚多模态数据形成统一数据湖,打破数据孤岛,并基于新一代列式存储格式实现多源数据的统一存储与元数据管理,为大模型提供高质量数据支撑。在数据处理全流程中统一权限管理,提供严格的资源隔离能力以保障数据安全;其次,提升异构算力利用率并强化调度安全,依托高性能分布式执行框架实现 CPU 与 GPU 在单一工作流中的混合调度,显著提升算力利用效率。同时,通过安全调度策略防止非法算力接入与资源抢占,确保数据任务执行安全可靠。最后,实现结构化、半结构化与非结构化数据的多模态安全集成,通过统一的数据管理与访问控制机制,使不同类型数据能够在同一可信环境下高效协同,既满足多样化数据处理需求,又确保数据安全与隐私保护。

03 应用成效

方案实施后,成功解决了多源异构数据协同处理难题,实现了车企、城市交通部门和地图服务商之间的数据可信联合计算,为辅助驾驶模型的性能优化提供了有力支撑。资源利用率显著提升,CPU 与 GPU 的协同调度有效解决了异构计算效率低的问题,使城市和企业算力资源得以充分释放。存储成本降低至此前的四分之一,在保障数据安全的同时,实现了高效计算与存储经济性,为多源异构数据的可信联合计算与模型持续迭代提供了长期支撑。

案例4:赋能影像 AI 模型联合训练

3779159adcf38cfbf2bc014b36f82b6501 需求分析

国内某医疗科技公司计划开发肺结节智能诊断 AI 模型,需整合多中心影像数据提升模型泛化能力,但面临三重核心难题。一是数据孤岛壁垒,不同医院的影像数据分散存储于异构系统,因数据主权与竞争关系,原始数据难以集中共享, 单一中心数据量不足导致模型无法覆盖疾病亚型与人群差异。二是隐私合规风险,医疗影像含患者敏感生理信息,受《个人信息保护法》《健康医疗数据安全管理规范》严格约束,传统集中式训练存在数据泄露风险,医院协作意愿低。三是数据质量不均,各医院设备型号、扫描参数不同,影像特征与标注标准存在差异,直接影响模型训练效果。同时,科技公司亟需在合规前提下,依托多中心数据完成模型迭代,缺乏安全高效的协作平台支撑。

02 解决方案

为解决上述问题,医疗可信数据空间整合人工智能与隐私计算核心技术,构建多中心协同训练体系:首先,搭建安全合规的数据汇聚基座,各医院通过数据连接器接入空间,医疗影像数据经零信任智能体自动识别敏感数据,经脱敏处理(隐去患者身份信息)后,上传至基于 TEE 可信执行环境的密态存储模块,结合区块链存证技术记录全流程操作,确保数据 “可用不可见”;其次,优化多源数据治理与质量提升,借助多模态数据湖实现异构影像数据的统一格式适配与元数据管理,为模型训练和精调提供标准化、高质量素材;最后,科技公司将基础影像模型部署至空间大模型管理服务中台,依托空间内汇聚的多中心标准化医疗影像数据,对基础模型进行训练精调,打造贴合临床场景的影像诊断垂直模型。

03 应用成效

方案实施后,成功破解医疗数据多中心协同训练的核心难题,实现了多家医院与科技公司的可信数据协作,为影像数据智能诊断垂直模型的优化提供了坚实支撑。模型性能大幅提升,依托多中心标准化影像数据完成精调后,诊断准确率与灵敏度显著提高,泛化能力得到有效增强。数据安全与合规得到充分保障,全流程脱敏处理与密态计算确保患者隐私零泄露,医院协作意愿大幅提升。同时,多模态数据湖实现了异构数据的高效治理,显著缩短了数据清洗与格式标准化周期,有效降低了模型迭代的时间与人力成本,为医疗 AI 模型的规模化开发与临床落地提供了可复用的长效支撑。

关键价值:

  • 为影像智能诊断垂直模型优化提供坚实支撑

  • 提升医疗AI诊断可靠性与适配性

  • 筑牢数据安全防线,促进多方协作

  • 支撑医疗AI模型规模化开发与临床落地

四、人工智能驱动可信数据空间发展展望

随着人工智能技术的不断成熟和可信数据空间的逐步普及,二者的深度融合将推动数据要素流通与价值释放迈向新的阶段。未来,人工智能的赋能将不仅体现在效率提升和成本降低,更将在安全保障、生态拓展和数据供给优化等方面深刻改变可信数据空间的发展路径。

总体来看,人工智能驱动下的可信数据空间,不仅能够提升数据要素的配置效率和创新潜能,也将推动数字经济实现高质量发展。展望未来,人工智能与可信数据空间的深度融合,将成为建设国家数据基础制度、打造数字竞争新优势的重要引擎,为社会治理、产业升级和民生改善注入持续动力。

01 安全防护智能化,构建动态自适应的主动防御体系。 未来数据空间的安全风险将呈现更加复杂和动态的特征,既包括传统的数据泄露与越权访问,也涵盖算法攻击、模型窃取、隐私推断等新兴风险。人工智能将成为可信数据空间安全体系的核心驱动力。一方面,通过实时监测、智能识别和持续学习,人工智能能够快速发现潜在异常,建立动态更新的防御体系,实现从事后补救向事前预防的转变。另一方面,人工智能可以结合隐私计算、加密计算等技术,推动数据在”可用不可见”的条件下流通,确保在开放共享与安全合规之间实现平衡。随着人工智能驱动的安全智能化不断演进,可信数据空间将在更大范围和更高强度的应用场景中保持稳定与可信。

02 资源交互智能化,驱动跨域数据的语义融合与协同创新。 可信数据空间的价值不仅在于单一行业的应用突破,更在于跨行业、跨领域的协同创新。未来,人工智能将在促进跨行业数据融合和价值链协同方面发挥关键作用。通过对不同来源、不同类型数据的智能解析和统一语义理解,人工智能能够打破行业边界,使金融、医疗、能源、政务等多领域数据无缝衔接。基于这一能力,可信数据空间将逐步从行业应用平台演进为跨行业创新枢纽,推动新产业形态和商业模式的涌现,成为促进产业协同和社会创新的重要基础设施。

03 要素供给智能化,实现数据价值闭环与基础设施升级。 可信数据空间的持续发展离不开高质量数据供给,而人工智能将在数据治理和质量提升中发挥重要作用。未来,人工智能能够对数据进行自动标注、清洗与分类,提升数据的一致性、准确性和完整性,从源头上改善数据的可用性。同时,人工智能还可通过价值评估与动态定价模型,优化数据在市场中的配置效率,引导更多主体提供真实、 完整、 可信的数据资源。更为重要的是, 人工智能将推动形成”数据—算法—应用”闭环,数据空间为人工智能落地提供基础设施,在确保数据主权和安全的前提下,为人工智能提供大规模、多维度训练数据,特别是解决高价值的行业数据获取难题。

编写单位

  • 火山引擎:王峥、胡茂盛、周皑杨、白兰、刘旭、廖双晓、孙德毅、李一浩、马可、黄梦娜、山浩、赵佳俊

  • 国家数据发展研究院:陈东、张钰雯、罗松、张弛、谢高畅、杨智博

来源:国家数据发展研究院、火山引擎

www.smartcity.team

为您推荐

发表回复