数据开放的几种形式
“流动的数据才能产生价值”。我们所有数据的接入、汇聚、治理、分析,最终的目的都是为了把数据更好地开放出去,实现“数据使能”。那么数据开放的形式有哪几种形式,各有什么优劣点,在项目中又该如何进行使用呢?
第一种是数据服务(DAYU 数据服务介绍)。数据服务通过将数据逻辑封装成统一标准的Restful 风格API,实现数据开放。数据服务带来的好处是非常直观的:
- 统一接口标准,减少上层应用对接工作量
- 将数据逻辑沉淀至数据平台,实现应用逻辑与数据逻辑解耦,在减少数据模型的重复开发的同时,避免数据逻辑调整带来的“散弹式修改”
- 将数据逻辑相关的存储与计算资源下沉到数据平台,降低应用侧的资源消耗
- 减少大量明细、敏感数据在应用侧的暴露,同时通过API 审核发布、鉴权流控、动态脱敏等手段,提升数据安全能力
但是在实际项目中我们发现,部分客户想把大量明细数据也通过数据服务的方式开放,这就与数据服务的设计初衷相违背。这个时候需要采用其他形式。
第二种是数据共享交换。数据共享交换在政务云比较常见,一般是通过将各委办局数据编制成统一的数据目录,其他委办局检索到对应数据表后可申请权限进行订阅,授权通过后即可获取到完整数据,并拉取到本地与自己的数据进行联合分析。数据共享交换解决数据服务无法共享大量明细数据的场景,但也给客户带来了很多安全上的问题:
- 隐私敏感数据不能公开。这里需要通过数据安全模块中的敏感数据发现功能来对隐私敏感数据进行识别及分级分类,并通过静态脱敏能力避免隐私敏感数据泄露。
- 数据共享交换平台需要支持对数据的权限管控、加密、签名等功能,防越权、防泄露、防篡改。
- 数据在泄露之后要可溯源,在保护客户数据版权的同时帮助客户发现安全薄弱点。这里需要通过结构化数据水印的功能,实现数据可溯源。
但这里的安全能力针对公安、金融等场景还是远远不够的,比如联邦模型训练、跨源分析等,都需要实现数据“可用不可取”。这个时候就需要采用可信智能计算服务。
第三种的可信智能计算服务(TICS)主要面向政企行业, 打破跨行业的数据孤岛, 实现行业内部、跨行业之间在数据隐私保护下的多方数据联合分析和联邦计算能力,基于可信硬件执行环境TEE、安全多方计算MPC、区块链等技术, 实现数据在存储、流通、计算过程中端到端的安全和可审计, 推动跨行业的可信数据融合和协同。更多介绍请见可信智能计算服务 TICS官方文档。
- 点赞
- 收藏
- 关注作者
评论(0)