一文看懂 | 数据流通3.0时代下的隐私计算

发布时间 2022-11-29
导语:

当下,数据作为数字经济时代最关键的生产要素,在社会生产、生活中的巨大价值已不言而喻。如何在安全合规的前提下实现数据流通,发挥其价值效应?其中,以隐私计算为代表的技术为数据流通的“可用不可见”提供了解决方案,成为当前技术主流。本文对隐私计算技术体系进行解析,介绍了启明星辰相关产品、技术及典型应用等,为用户数据安全建设提供思路及建议。

数据流通3.0时代成为必然趋势

2019年10月,中共中央十九届四中全会公报上首次明确将数据纳入生产要素。数据成为数字经济时代的新型生产要素。

数据要素是推动经济增长的新引擎,2022年1月12日,国务院印发了《“十四五”数字经济发展规划》,提出要“充分释放数据要素价值,激活数据要素潜能”,强调要“坚持系统推进、协同高效。充分发挥市场在资源配置中的决定性作用,构建经济社会各主体多元参与、协同联动的数字经济发展新机制”。数据价值的发挥及经济效益的产生,离不开数据资源化并参与社会生产活动实践。这就决定了数据的开放、共享协同将成为未来发展的必然趋势。

现今,数据正以难以想象的速度带来新一轮的信息化革命,不断冲击和改变各行各业的生态体系。在从“IT”向“DT”升级时代,数据成为重要资产,企业则从独享转向分享,致力于利用数据和数据分析技术研发新的产品,创造新的价值。在数据流通和交易领域,需要各个产业链上下游合作企业进行深度合作,只有通过各方数据协同应用,才能更好地释放数据价值。

隐私计算助力数据要素安全流通

随着数据流通及共享的经济价值、业态发展为全社会所认知,越来越多的业务场景不断涌现。在金融领域,银行涉及诸多与外部数据联合建模的需求,实现数字营销、流失召回、智慧风控及反欺诈等。在医疗领域,病例数据作为医疗机构最重要的隐私数据,需要与大量外部医疗机构、医药公司、科研机构等进行样本数据的大规模模型训练,用于医疗研究与医疗诊断。在政务、能源、交通、环保、工业和电信等具备大量数据基础的领域,数据共享和利用已经成为规划和落地应用必不可少的部分。


各个业务场景主体拓扑图


各个业务场景均需要多方数据的流通和共享。隐私计算主要是解决多个参与方数据不出本地,在保护数据安全的同时实现多源数据跨域合作的问题。利用隐私计算技术保障多方协作过程中敏感数据信息的安全,实现数据“可用而不可见”已经成为业界共识。

隐私计算是在数据流通过程中,在计算环节解决信息保密问题的技术路线的统称。可将其定义概括为——在不传递始数据或保护原始数据的前提下,实现数据的分析、计算、应用的一类技术集合或体系。从技术机制来看,隐私计算主要分为三大技术路线,即多方安全计算(密码学)、联邦学习及可信计算环境。

一、多方安全计算

多方安全计算(Secure Multi-Party Computation,MPC)由姚期智在1982年提出,指参与者在不泄露各自隐私数据情况下,利用隐私数据参与保密计算,共同完成某项计算任务。


多方安全计算示意图


该技术能够满足人们利用隐私数据进行保密计算的需求,有效解决数据的“保密性”和“共享性”之间的矛盾。多方安全计算包括多个技术分支。目前主要用到的是技术是秘密共享、不经意传输、混淆电路、同态加密、零知识证明等关键技术,可认为多方安全计算是一堆协议集。

二、联邦学习

联邦学习(Federated Learning)是一种新兴的人工智能基础技术,在2016年由谷歌最先提出,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。其中,联邦学习可使用的机器学习算法不局限于神经网络,还包括随机森林等重要算法。联邦学习有望成为下一代人工智能协同算法和协作网络的基础。


联邦学习原理图解


在整个联邦学习的过程中,各参与方的数据始终保存在其本地服务器,降低了数据泄露的风险。

三、可信计算环境

可信执行环境,亦称为可信硬件。其核心思想是构建一个独立于操作系统而存在的可信的、隔离的机密空间,数据计算仅在该安全环境内进行,通过依赖可信硬件来保障其安全。

可信执行环境的最本质属性是隔离,通过芯片等硬件技术并与上层软件协同对数据进行保护,且同时保留与系统运行环境之间的算力共享。目前,可信执行环境的代表性硬件产品主要有Intel的SGX、ARM的Trust Zone等。


Intel SGX 硬件部署


不同的技术路线,均尤其技术特点和缺点,需要根据实际业务场景应用不同的技术来解决数据流通过程中的合规需求。

隐私计算平台进入落地应用阶段

随着数据要素市场化的推进,隐私计算的应用场景正在具象化,应用场景越来越丰富。行业开始从概念阶段进入实施阶段。

启明星辰2022年初于杭州“DT”总部发布集团数据安全顶级战略“数据绿洲”,定义了基于对象安全的1.0-数据安全单点技术能力,基于数据汇聚安全的2.0-数据安全平台管控能力,及基于数据安全流通的3.0-共享、开发要素化市场变现能力。


隐私计算平台架构


隐私计算平台作为数据流通3.0阶段的核心产品,其作用是在保护隐私信息的前提下,进行数据价值分析与挖掘的,实现“原始数据不出域、数据可用不可见”,数据使用“可控可计量”。平台架构以从四个层级出发,底层对接范类数据来源,支持的协议种类丰富,平台层集成各类隐私计算核心功能;应用层覆盖多品类数据安全隐私流通场景。

启明星辰隐私计算平台是可以实现隐私数据共享的综合性业务处理平台。在保护数据提供方隐私信息的前提下,具备安全、正确的基于密码理论的可靠性;具备多技术路线、丰富场景磨合的技术先进丰富性;具备符合高规格、高可用的安全计算性;具备适配全国产化、独立自主研发的创新、安全性。

平台设计的主要功能从实用性出发,包含对数据流转监控的数据管理,对项目统一分派全流程执行的项目管理,对合约审批、查阅及计量的合约管理,对隐私计算任务的全局作业管理,对日志全程审计的日志管理,对API、硬件资源、平台使用的监控管理,对账户角色统一授权的账户管理,及提供包括联合统计、联合建模、隐私求交隐秘查询的相关服务。

隐私计算平台支持集中部署及分布式部署,已为包括数字政府的不动产隐秘查询、公共安全治理;金融科技的银行间黑名单共享、个人消费贷款;智慧医疗的服务诊疗与医疗科研;数据交易的数据交易所等场景提供了包括:隐秘查询、数据“可用不可见”级共享、个人隐私脱敏保护、多方安全计算及数据全程追溯等技术服务。

随着隐私计算这一新兴技术逐渐被大众接受与熟知,隐私计算在运营商、政务、金融、互联网等行业的落地场景也越来越多。启明星辰集团将积极发挥技术优势与经验沉淀,用高性能的产品与高品质的服务,为数据经济高速发展保驾护航。