GON:金色观察|联邦学习是区块链隐私计算的目标吗?_ICK

区块链行业里有一个很垂直的赛道,技术攻坚很艰涩,这就是对数据进行隐私处理的隐私计算。

为什么呢?

一是因为对数据处理的产品复杂度,二是技术上还有很多很多问题存在。用区块链基础设施来做,太过于简陋,这个举例好像,一个人住进一个没装窗户却有一个窗口的屋子,只能先挂个帘子挡一下。没有装窗户的原因是因为,这个地区没有生产窗框、玻璃的企业,也没有会安装的师傅,只能先用纸糊上或者挂一个帘子,更厉害的,直接把窗户封上。

区块链隐私计算现在就是这种情况。

为了实现web3,未来隐私计算一定会解决数据隐私问题,而这种需求面临的目标是什么?也许是联邦学习。虽然这是一个人工智能领域的基础技术,但它定义了一种数据不离开所有者的数据处理方向。

金色财经合约行情分析 | BTC持仓量处于近期低位,观望情绪较浓:据火币BTC永续合约行情显示,截至今日18:00(GMT+8),BTC价格暂报11784美元(-0.10%),20:00(GMT+8)结算资金费率为0.039217%。

BTC昨晚下探至11588美元后有所企稳,目前价格在11700美元上方窄幅盘整。根据火币交割合约数据,BTC当季合约成交额大幅下降,持仓量继续下跌,精英多头占比略减,当季合约正溢价略降。BTC持仓量处于近二十天低位,价格在低位震荡,多空双方观望情绪较浓。

USDT于火币全球站OTC的报价为6.88元,溢价率为-0.52%。[2020/8/20]

我们为什么要做数据隐私,也是因为平台等中心化的角色会利用数据做一些分析利用,中心化角色也是利用数据进行深度学习,以汲取数据中的价值。

金色财经行情播报丨BTC小幅震荡 多头发力仍需蓄势:据火币行情显示,今日BTC整体保持小幅震荡平台整理,上午9时小幅拉升平台突破,价格徘徊于9300USDT附近。日线图前日拉升后保持震荡格局,承压于均线MA30,9400USDT附近压力位较大。4小时图下行通道终结,站上均线。1小时图平台突破但多头若要发力仍需蓄势。截至10:00,主流币的具体表现如下:[2020/7/8]

可见,联邦学习或许是一种目标选择。

先看定义:

联邦学习在2016年由谷歌最先提出,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。

金色相对论丨林念龙:IPFS矿机技术门槛低 但技术很牛:本期金色相对论在讨论上,在讨论IPFS矿机热话题时,蜂窝联合创始人林念龙认为:有硬盘和带宽的机器,理论上都可以叫IPFS矿机,比显卡机技术门槛还低。目前ASIC的厂商估计都看不上,深圳一堆的电子厂都可以做出来,当然IPFS这个技术的确很牛。同时林念龙还表示还是老老实实挖大币种BTC,盘子大不易砸。小币种矿机挖矿收益纯拼运气和手速,晚一天,都会赔进去的感觉,比如迅雷的玩客云。[2018/6/27]

再看框架:

两个数据拥有方的场景是联邦学习的标准统构架。该构架可扩展至包含多个数据拥有方的场景。假设企业A和B想联合训练一个机器学习模型,它们的业务系统分别拥有各自用户的相关数据。此外,企业B还拥有模型需要预测的标签数据。出于数据隐私保护和安全考虑,A和B无法直接进行数据交换,可使用联邦学习系统建立模型。

金色独家 中伦律师事务所合伙人于鲁平:任何没有实体项目所支持的虚拟产品都是空洞的:今日,就前央行行长周小川得发言,金色财经独家采访中伦律师事务所合伙人、中央财经大学博士后于鲁平,于鲁平表示:所谓纯粹炒作性的数字类、加密类的产品实际上是脱离实体,没有任何产业支持以及资产保障的产品。这类产品不能算作是虚拟商品或者虚拟资产,除了概念炒作以外没有任何实际价值。任何没有实体项目所支持的虚拟产品无论其外观包装如何丰富,其本质都是空洞的,有可能成为各种经济犯罪的载体。

在金融创新的当下,各种新概念新技术层出不同,数字经济、数字资产等概念也被频频提起,渐入人心。与此同时,我们应该理性的看到,对这些概念本身的相关理论研究才刚刚起步,众多商业模式亟待检验,很多监管方式尚需实践。对所谓虚拟产品风险的最基本判断应当是抛开华丽的炒作包装而探究其商业实体。而监管的重要设计思路之一应当是通过对规则和制度的有效创设,将当下的虚拟产品概念和实体项目进行硬连接,即将金融创新和实体经济进行价值衔接。

与此同时,也要充分发挥市场的有效配置作用和价值甄别作用,用优质项目驱逐伪劣项目。目前,即便我们有可能通过技术创新了交易的形式,也并没有改变交易的本质。没有脱离实体应用而存在的技术创新,也不会有脱离实体经济而存在金融产品。[2018/6/14]

第一步:加密样本对齐。系统利用基于加密的用户样本对齐技术,在A和B不公开各自数据的前提下确认双方的共有用户,并且不暴露不互相重叠的用户,以便联合这些用户的特征进行建模。

第二步:加密模型训练。在确定共有用户群体后,就可以利用这些数据训练机器学习模型。为了保证训练过程中数据的保密性,需要借助第三方协作者C进行加密训练。过程中协作者C把公钥分发给A和B,用以对训练过程中需要交换的数据进行加密。A和B分别基于加密的梯度值进行计算,最后把结果汇总给C。C将结果解密,分别回传给A和B。

第三步:激励。联邦学习解决了不同机构加入联邦共同建模的问题,建立模型以后模型的效果会在实际应用中表现出来,可以记录在区块链上。提供数据多的机构所获得的模型效果会更好,模型效果取决于数据提供方对自己和他人的贡献。

这个过程里,

数据隔离,不会泄露到外部其他人,满足用户隐私保护和数据安全的需求;训练有效;参与者地位对等,公平合作。

这个时候看,区块链可以在数据所有权、联邦贡献度等部分起到决定性的作用。所以是不是一个非常完美的适合用区块链来做的模型。

但目前的隐私计算区块链还不能完全做到这些,主要问题在于:

1.对数据操作的颗粒度还不能完全去中心化到个人。

2.算力不够、存储不够。

3.只用智能合约无法执行庞大的复杂的过程。

4.缺少PaaS以及BaaS这样的中间层服务。

5.链上应用的隐私需求少。

在这些问题的影响下,确实没办法实现,也许有人会认为,比如链上混币,或者查不到交易详情的隐私币是不是就可以算是另一个方向的隐私了。

对,这是另一个方向的隐私需求,这个需求已经可以实现,只是联邦学习的路会更长远一些。

在联邦学习之前,为了防止交易数据明文、合约代码明文会带来更多的安全问题,具备隐私保护能力的链上环境,可以用黑箱的方式保护交易、保护合约,保护资产。这里面有tee、mpc、zksnark等方式。

这些对于一个复杂的数据训练网络来说,都是简陋的结构了。

以太坊是世界计算机,在以太坊出现之前,互联网先是活在机房里,现在机房构成的庞大算力组合成云,互联网活在云上,云是一个组合的没有硬件限制的世界计算机,只是没有去中心化结构。

在云服务中我们可以看到涉及隐私计算的相关服务已经上线很久,比如AWS的数据湖和数据仓,比如阿里云的datatrust以及腾讯在可信平台上的服务,都是向这个方向看齐。

最后,让我们看看在云服务的架构下形成的可信数据处理架构:

当云服务部分,被联盟链云服务中的区块链所取代或者被去中心化云服务平台取代时,web3就要成功了。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

区块博客

[0:15ms0-7:404ms