SEN:科普 | 数据隐私保护机制+区块链应用场景大盘点_BRO

本文为万向区块链蜂巢学院公开课第六课上的课程内容。导师谢红军在区块链和密码学技术研究方面有着丰富经验。在课堂上,他首先带大家回顾了区块链技术是什么,又分析了区块链在十多个领域内的应用,最后有分享了两个他们正在探索的隐私计算案例。

以下内容整理自现场速记稿,有部分不影响原意的删减:

谢红军老师

大家好!很高兴与大家分享我个人和矩阵元在区块链和密码学技术研究方面的一些认识,以及相关应用案例。今晚我们一起来探讨下区块链到底会产生怎样的价值,在哪些领域可以落地,以及它是不是真的能快速落地。

数字时代,数据作为新型生产要素,业已成为企业和国家具有战略意义的核心资产,数据共享和流通已成为刚性需求,然而,数据的隐私保护和数据高效流动间的矛盾,却日益凸显,这在很大程度上,制约着数据的价值兑现。能否有一种技术,完美回答和解决上述问题。现在看来,区块链技术、密码学技术就显得非常重要而必要。

今天我的分享分为三部分:

第一部分我会和大家一起回顾下区块链技术到底是什么;

第二部分将分享区块链技术在各行业的应用;

第三部分将分享两个隐私计算案例。

复习:区块链技术是什么?

截取自比特币白皮书

区块链技术起源于化名为中本聪的技术极客在2008年发表的奠基性论文《比特币:一种点对点电子现金系统》,上图就是比特币白皮书。到2009年1月,比特网络上线运行,这标志着全球第一个区块链网络的诞生。

那么,到底什么是区块链?简单地讲,区块链就是一种链式数据结构。利用块链式数据结构来验证与存储数据,利用分布式节点共识算法来生成和更新数据,利用密码学的方式保证数据传输和访问的隐私和安全,利用由自动化脚本代码组成的智能合约来编程和操作数据。

要真正理解比特币,首先要了解下面四个概念:

1、PeertoPeer

又称“对等网络”。这个和金融的P2P是两件事,它是指点对点分布式网络的特征。在比特币网络里,没有哪个节点是中心化的,没有哪个节点是不可或缺的,参与共识的节点其角色相互对等,每个节点都存储着完全相同的公共账本,这就叫去中心化的PeertoPeer网络。

国务院:推进科普与区块链技术深度融合:为贯彻落实党中央、国务院关于科普和科学素质建设的重要部署,依据《中华人民共和国科学技术进步法》、《中华人民共和国科学技术普及法》制定《全民科学素质行动规划纲要(2021-2035年)》,其中要求实施智慧科普建设工程。推进科普与区块链等技术深度融合,强化需求感知、用户分层、情景应用理念,推动传播方式、组织动员、运营服务等创新升级,加强“科普中国”建设,强化科普信息落地应用,与智慧教育、智慧城市、智慧社区等深度融合。(新华社)[2021/7/10 0:40:52]

举一个例子,大家去医院看病,需要使用现金或者扫码、刷卡挂号,看完病以后医生会说做什么检查,再返回窗口排队付费,之后再检查,检查完以后拿上检查结果排队找医生再看。实际上这里面的所有过程都是支付的过程,每个人的医保卡里都有“巨额资金”,是积累了很多年的“沉睡的钱”。医保卡里的钱和人民币的现有支付系统没有打通,不能快速的实现在线支付,造成了反复排队。这些流程性的东西因为支付不能打通,所以点对点不能实现。

2、Hash

又称“哈希”、“数据散列”、“数据指纹”。哈希就是数据指纹,计算数据指纹的函数就是哈希函数,它可以把任意长度输入数据加工成一个固定长度的输出数据,这个输出数据就是哈希值。一个良好的哈希算法有两个特性:一个是“雪崩效应”,一个是“不可逆”。雪崩效应是指输入数据任何的微小变化都会引起其哈希值的巨大变化,不可逆是指在现在使用现在的计算机技术在现有的数学算法上无法根据哈希值反推出输入数据。

3、Blockchain

我们来看这两个区块,每个区块的内部,主要包含了在当前区块中,达成共识的交易和区块哈希,以及父区块的哈希。区块正是通过父区块的哈希链起来,形成一个单向链。这就是区块链。

可以把Blockchain分开看,Block就是区块,里面记录了交易信息、这个块本身的哈希信息、以及上一个区块的信息,通过上一个区块的哈希值把所有块链接起来变成块链式结构,就是所谓的Blockchain。

4、ProofofWork

俗称挖矿。区块链中新区块的生成意味着其中某个节点获得此区块的记账权。而获得记账权的过程即为“挖矿”,它通过节点自身的算力资源以哈希碰撞的方式来解决预先所设定的一道数学难题。成功解决,即挖矿成功,而率先成功的节点也会被系统返还一定的价值回报。系统以此方式,来激励网络中所有节点来参与挖矿过程。

动态 | 报告:区块链等热点词促使童书科普百科类成交额同比增速最高:近日,京东图书与艾瑞咨询联合发布了《2019中国图书市场报告》。报告指出,AI、5G、区块链、机器人、VR、智能家居、AR这些热点词,不断点燃科技热潮,科技在改变大众生活的同时,也吸引了越来越多家长的关注,从小培养孩子对科技的兴趣和热爱。因此童书中科普百科类成交额同比增速最高,占比将近40%。[2020/1/8]

区块链网络另一个典型代表是以太坊。以太坊是由VitalikButerin受比特币启发后,提出的一个开源的具有智能合约功能的开放区块链平台。比特币虽然是最早提出的区块链技术,但比特币网络不足以构建更高级的应用。以太坊从设计上主要是为了解决比特币生态扩展性不足的问题。以太坊通过以太坊虚拟机(EVM),来运行部署在以太坊区块链上的智能合约。

根据工信部电子标准化院《区块链参考架构》,区块链分为公有链、联盟链和私有链。

比特币、以太坊都是公有链,但在现阶段企业级落地、进行实体对接的主要是联盟链。联盟链相比公链,存在两个重要区别点:一般并无密码货币,以及节点准入机制。在联盟链中,一般不存在密码货币,并且要成为联盟链系统中的节点,必须经由系统中承担管理员角色的管理节点进行审核,通过后才能加入此联盟链网络。从应用场景角度上来说,联盟链更具优势,适合企业间应用。

2015年9月,美国科技公司R3CEV联合包括摩根士丹利、高盛、汇丰在内的40多家全球知名银行,共同成立了一个企业区块链联盟——R3Corda,即为区块链世界中第一个对外公布的联盟链。同年12月,Linux基金会也主导发起了另一个联盟链项目-Hyperledger,已吸引了IBM、Intel、JPMorgen、富国银行、华为、百度等科技金融企业的加入。

区块链技术目前的发展中也存在一些挑战:区块链技术创新日趋活跃;仍在场景尝试,落地应用少;基础设施不够完善;效率和安全性低;法律法规和技术标准仍不完善。

但它未来的发展趋势一定是“技术融合”。云计算提供基础设施,IOT主要解决了信息的采集和感知问题,区块链主要解决了信息的可信传递问题,大数据提供数据的安全保护及资源提供,人工智能则主要解决了信息的智能化处理问题。

举个例子,这么多大数据为什么仍然面临没有满足训练的数据?一是因为别人不愿意分享数据,怕数据泄漏。数据的拥有方往往是大型机构或政府部门,当然互联网平台和厂商里有大量的数据,大家都不会彼此分享;二是如果我分享了数据,我不知道你到底用在哪里用了多少次。因此,数据流动和交易的意愿特别低。区块链能解决数据可信传输的渠道,包括交易、清结算,未来区块链都能做。

动态 | 链客社区联合北京交通广播推出区块链技术科普节目:12月11日15:15—16:00,区块链技术社区——链客区块链技术社区将联合北京交通广播FM103.9从零开始为大众科普解码区块链技术,蜻蜓FM及北京广播网同期进行全球直播。首期做客嘉宾为链客区块链技术社区创始人郄建军和百度区块链产品负责人于雅楠。[2019/12/11]

最后总结一下,区块链是一种基于密码学技术的分布式系统。区块链技术是下一代计算架构当中的重要组成部分,是类似于分布式网络操作系统级别的计算架构基础设施,也可以理解为“超级数据总线”来实现未来多源异构数据的互操作问题,同时支持基于可证明密码学和复杂计算理论的隐私保护。

区块链在各行业的应用

这是国外报道的Facebook对数据的收集。目前世界上的互联网公司都是这样收集数据的,Facebook和Google的年报里,广告收入占比超过90%,靠的是背后的数据来支撑商业模式。

2018年5月25日,欧洲联盟出台《通用数据保护条例》,针对的是对隐私泄露的监管和处罚。在今年10月份的乌镇互联网大会上,司法部副部长赵大程介绍《隐私保护法》正式列入了十三届全国人大的立法规划,一旦进入立法的话一定有监管、监督、处罚的措施,这就要求互联网企业尽快完成对数据隐私保护的改革,必须确保在合法数据获取、使用、保存的情况下进行使用。

前面讲的是个人隐私数据,我们来看一下大数据。前几年全国各地的大数据交易中心蜂拥而起,但是大数据交易中心的业务却不多。为什么呢?因为大数据交易面临着这些问题:数据流通与可交易的范围界定,数据所有权界定,数据的质量评估与定价,数据质量评估,数据定价,数据安全,数据交易标准与立法。

现在互联网服务大部分都是免费的,为什么他们愿意免费提供服务呢?因为他们收集使用者的一些信息。以便利、免费的服务换取隐私数据,这就是交易,否则天下没有免费的午餐。

有没有办法把数据隐私保护起来,并把数据产生的价值分享起来?不管你是交易还是流通、计算,产生的价值都要分给数据生产者。

出于数据泄露及自身利益考虑,掌握大量数据的机构和主体不愿开放自己的内部数据,尤其是重要数据。任何单一机构永远都只能掌握数据全集的一部分,只有将多方数据协同计算才能实现数据价值的最大化。

动态 | 人民日报官方微博科普区块链 强调区块链不等于比特币:人民日报官方微博今早发表9图科普区块链。其中涉及区块链的特点有:1、安全;2、不可篡改;3、可访问;4、无第三方。区块链对未来的影响:1、不需繁琐个人证明;2、看病避免反复检查;3、旅行消费更加便捷;4、交易无需第三方。同时强调,区块链不等于比特币。比特币只是区块链技术的一种应用,区块链还有医疗卫生、食品安全、版权保护等诸多应用领域。[2019/10/28]

截取自《中国区块链技术和应用发展白皮书》

《中国区块链技术和应用发展白皮书》里介绍区块链到底能做什么,区块链能做的很多,我们一起来看几个案例。

1、数据可信记录与认证

从数据视角看一下,区块链在密码学和隐私保护情况下能做什么?

数据记录:数据信息、文件材料、图片记录等信息皆可在区块链上进行记录与存储,并保留在各用户账户地址中,区块链上存储信息可通过哈希值进行存证。

数据认证:链上记录的信息可通过其他参与方对数据进行签名确认的方式,进一步提高数据可信度。

数据验证:可通过对哈希值的验证匹配,实现信息篡改的快速识别。

2、数据安全共享和追溯

区块链多节点特性可保证多方间的数据实时共享;并且可按用户、业务、交易对象等不同层次实现数据和账户的隐私保护设置;基于链上数据的记录与认证,可通过智能合约设置,实现按照唯一标识对链上相关数据进行关联,构建数据的可追溯性;用户或需求方可通过DAPP应用直接访问区块链上数据记录,提供数据增信能力。

3、资产确权与数字化流通

通过区块链组建的联盟链可连通核心企业、多级供应商、保理公司、银行、ABS等相关机构,通过在链上登记、确权、资产数字化操作,将链上资产的发行、流通、拆分、兑付等操作进行实时同步,使各关联方间的信息更加对称。由技术不可篡改和不可抵赖性建立起的互信机制,可以打通供应链金融中的信任传导通道,将原本不可拆分的金融资产数字化,提升资产流动性,降低中小企业的融资成本。

4、数据协同操作

“MPC”是去年和今年特别火的词,区块链+MPC的结合,使原始数据在无需归集与共享的情况下,可实现多节点间的协同计算和数据隐私保护。同时,能够保护数据所有权,解决大数据模式下存在的数据过度采集、数据隐私保护,以及数据储存单点泄露等问题。

中科院自动化研究所将面向大中小学生开展区块链等主题的科普讲座:5月21日,新华网讯,今年,中国科学院自动化研究所将举办第十四届“自动化之光”公众科学开放日活动。届时,自动化所将面向大中小学生分别开展《脑与智能》、《区块链技术与平行智能》、《大数据时代的视觉智能》、《动画真奇妙》等4个主题报告,用实例和生动的演示深入浅出地为大家揭示智能技术的原理和奥妙。[2018/5/21]

5、数据协同管理

区块链+MPC的运用,还可以有效连接政务各部门间的数据孤岛现共享或归集难题,在数据不做归集,数据存储不发生迁移的情况下,为企业提供数据信息或事物办理的协同操作能力;解决政务信息共享“最后一公里”,改善降低企业办事多头跑、重复提交材料的现状。

6、区块链与存证和溯源

这个在网上能搜到很多案例。在数据登记环节,基于区块链技术记录产品生产各环节信息,形成数码数据、环节生产数据、流通数据、消费查询数据的全方位信息档案同步和管理,并且支持扫描设备读取信息后直接加签上链,确保一手信息来源。在信息查询与验证阶段,用户可自主选择联盟节点进行信息查询,数据处理逻辑是通过智能合约维护,为用户提供原始数据验证渠道。

举一个存证的案例,北京互联网法院在最近接入了“天平链”,电子证据即时上链,安全保密、难以篡改;法院全程记录、全程可控,电子证据采信率高;而且多家平台规范取证,流程简便,费用低。

7、区块链与医疗健康

医院的数据基本不会分享给企业,并且监管机构推行分级诊疗,小病小地方看,大病大地方看,很多人吐槽把老百姓选择看病的权利剥夺了。另外,还存在药品追溯体系不健全;病患医疗信息在医院间不互通,重复检查,加重患者负担;纸质票据、处方流通不利于保存、有安全风险等问题。

假如把这些人所有的数据使用区块链共享起来,那么会发生什么呢?

1、结合物联网技术对药品进行实时追踪监管,辅助质量监管,杜绝假药。

2、在确保患者隐私的情况下,实现患者医疗信息脱敏及机构间共享,减少重复检查,提高诊治效率。

3、重要票据和处方上链存证,处方不能被篡改。

4、可信数据存证及智能合约使医疗保险赔付更准确便捷。

5、利用区块链去中心化存储,限制数据的访问权限,以保障就医者的信息、诊断记录、基因数据等医疗信息的安全。

医院的数据和其它机构的结合起来是十分有价值的。举个例子,医院数据通过明文不流通放在本地,提供给药厂进行新药开发,因为可用的数据多了,时效更快了,药企就可以比较快地把新药投放市场,最终药价也会下降,患者看病的负担也会下降。

另外一个例子,慢性病在我们国家造成医院资源浪费的成本增长是不可想象的。我们国家的医疗体系只保障基本的医疗,大量病是无法不管的。保险公司愿意开发慢性病保险,但是他没有数据训练模型,不能准确地开发保险,不能准确地定价保险,不能准确地营销保险。如果他有医院的数据,可以开发一款适合老百姓慢性病问题的保险,那么老百姓看病的负担就会更轻了。

8、区块链与供应链

供应链就是解决全链条既长又慢又需要大量认证、资格审查才能进行资金的投放、追踪,区块链、密码学就能解决这个问题,把需求流动起来,大家都在一个链上共识可以很快地解决。供应链过程均上链存储,保证全流程可追溯;不可篡改有助于后续对于整个供应链系统的审计;智能合约作为区块链的图灵完备语言,可实现清算逻辑,并能将业务逻辑与清算逻辑融为一体,达到业务完成即清算的效果,可极大降低清算成本;对于供应链系统中的不同相关方,在当需要共同使用由单方面持有的隐私数据时,密码学中的隐私计算技术可实现在不泄露原始数据信息的前提下,对隐私数据进行多方协同分析,解决其中所涉及的隐私问题。

举个例子,万向区块链供应链金融服务平台是万向区块链自主研发,针对供应链链条各角色设计的金融服务平台,旨在以核心企业为中心,以实际贸易背景为基础,根据交易中构成的链条关系和行业特点设定的一种应收账款债权流转融资平台。该平台目前已吸引众多中国优秀企业入驻,并实现降本增效,产业升级;此模式解决了传统制造行业供应链中强势企业占用资金时间长,影响供应链整体协同效率等痛点,最终以提高金融资源在供应链属企业间的配置与效率。据我所知,目前平台上发生的融资金额已经超过2亿人民币了。

9、区块链与身份服务

身份服务,是前段时间我们和医疗保险协会做的,后来发现银行间有黑白名单共享。同一行业里的不同机构有很多联盟,大家又想利用对方的用户信息又不想信息共享。MPC可以很好地解决这种问题,把结果输出给服务提供方,那这一次所有的计算、交易就完成了,你要对查询负责并付出一定的查询费,该费用及时通过系统上的清结算交易。这种解决方案可以扩展到不同行业,医疗行业、保险都可以。

10、区块链与物联网

区块链+物联网可以解决数据所有权问题、数据隐私保护问题、数据可信问题、数据安全共享问题、数据协同计算问题、数据清结算问题等。

11、区块链与能源

分布式能源是很大的区块链解决能解决的问题,未来能源很多,如火电、水电、太阳能等,这些电现在的做法是全部上国家电网。但新能源电不稳定,有风的时候电能很多,没风的时候太阳能电来了,对电网冲击很大。利用区块链技术,实现分布式能源,你家楼顶上的太阳能电,多余的时候可以经过局部社区网络自动卖给其它需要电的邻居,交易完马上结算。这既能减少对国家电网的冲击,也能有效利用能源。

12、区块链与机器学习

区块链能够为机器学习提供合规训练数据和算法,解决数据隐私保护问题、数据清结算问题,实现数据、算法的共享。

区块链不光可以帮着算法寻找可用的数据,还可以帮助算法在平台上进行交易和流通。智能合约可以解决清结算的问题。数据保护的问题解决了,那数据面向算法提供服务的意愿就大。

隐私计算应用案例

1、分布式安防

现在大街上有很多监控设备。如何使用隐私计算、隐私AI技术?首先要在数据采集端做行为数据隐私保护,对监管部门来说当可以实现穿透式。经过采集、监控场所以及安全报警措施系统,更好地基于数据的隐私保护实施分布式安防。

2、医疗影像诊断

有医疗行业从业者问区块链能解决医疗的问题吗?国家对于电子病历的格式和标准都有规定,但实际上医院与医院之间、科室与科室之间、医生与医生之间的电子病例都不一样。这个问题如何解决。影像学也一样,拍的影像如何进行隐私AI智能化识别和辅助诊断?

之前我和一个医院同事聊脸部偏瘫如何远程诊断?有很多脸部偏瘫的人不愿意去医院,这个病会造成心理疾病,不愿出门。但现在有一种技术是远程诊断,摄像头是物联网设备,让你笑,让你嘴向左、向右、向上,或者进行行为训练。但在这一过程中,患者会露出丑态,这对患者来说是种负担,而且对患者的隐私保护也可能做的不到位。如果未来用户隐私AI技术保护了患者的隐私又能进行行为训练,那么就能减轻患者的负担,增加康复的几率。

现代社会产生了大量数据,而且大家对自己隐私数据的保护越来越重视,所以隐私保护技术、隐私计算、隐私AI呼之欲出。对监管者和监督者可以进行一定的数据透明化,但是对商业机构没有义务提供数据。核心就是要解决这几个问题,数据的安全存储、统一的身份认证、隐私保护、数据流通后的价值、进行快速准确无偏袒的清结算。

最后,我想强调一下,所有技术应用逻辑都是数据流动的逻辑和清结算的逻辑,解决这个逻辑就解决了现实社会、实体经济中的流程复杂、分享意愿不坚决问题,才能让区块链服务老百姓、为实体经济造福。谢谢大家!

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

区块博客

[0:15ms0-7:544ms