CEL:谷歌隐私交集和技术解析2—技术概览_LAYER

上一篇文章我们分析了谷歌开源库的应用场景,本篇文章对其技术进行分析。

谷歌这个开源库是利用已有的密码技术成果,对已有技术组合从而达到解决问题的目的。有点像比特币,都是站在巨人肩膀上。

谷歌是如何从学术界摘果子来解决工业界实际问题的呢?

谷歌这个开源库的主要工作就是设计一个切实可行的密码学安全计算协议,其目的是为了工业界的使用。

01

问题模型

该协议解决的主要问题就是计算隐私交集和。

问题模型可以抽象为:

有两方各自拥有包含用户身份的数据集,其中一方还拥有与用户身份相关的一个整数,例如该整数可以是该用户的交易金额。双方想知道如下内容:

声音 | 知情人士:谷歌进入数字金融领域,拟推出“Cache”支付平台:据透露,谷歌正在与金融机构合作推出一个代号为“Cache(缓存)”的新项目,旨在为Google Pay客户提供支票账户,该项目最早将于明年开始。这意味着该公司将在苹果(Apple)、亚马逊(Amazon)以及Facebook之后,成为最新进入数字金融领域的科技巨头。据华尔街日报援引知情人士称,该项目的账户将由花旗集团和斯坦福联邦信贷联盟(Stanford Federal Credit Union)负责管理。谷歌高管Caesar Sengupta称,不会将Google Pay数据用于广告宣传,也不会与广告客户共享该数据。(BeInCrypto)[2019/11/14]

(1)双方拥有的共同用户数量;

声音 | 前谷歌和Facebook高管:BTC真正的市值占比可能是75%以上:8月6日,前谷歌和Facebook高管、目前经营加密货币资产管理公司Electric Capital的Avichal Garg在社交媒体上表示,衡量比特币市值占比的标准方法存在缺陷。计算市值的数据来源,尤其是CMC,引用了数千种加密货币,包括那些根本没有流动性的货币。他认为,这种加密货币数据与计算无关,因此稀释了比特币的真实市值占比。Garg表示:“BTC真正的市值占比可能是75%以上,而且很长一段时间以来可能一直是60%以上。”(Bitcoinist)[2019/8/6]

(2)在不泄露用户输入的任何隐私信息下,这些共同用户所对应的整数之和。

乌克兰黑客组织通过购买谷歌搜索结果广告位 盗窃超过5000万美元的加密货币:据美国财富杂志,思科的Talos网络安全团队周三公布的一份报告显示,一家名为Coinhoarder的乌克兰黑客组织盗窃了数字货币钱包最受欢迎的供应商Blockchain.info的用户超过5000万美元的加密货币。该报告解释了小偷如何使用“非常简单”但又险恶的技术来受害者:他们在谷歌搜索结果中加密货币相关的关键词上购买了广告,当人们在谷歌搜索例如“区块链”或“比特币钱包”这样的术语,搜索结果中的广告伪装成Blockchain.info钱包的域名,被链接到恶意网站。例如,黑客购买像“blokchien.info/wallet”和“block-clain.info”的广告链接。投资者以为他们到了正确网站后,输入了隐私信息,黑客便能够获得他们钱包并取走它们的加密货币。[2018/2/15]

这就是一个隐私交集和问题。

该问题不是一个空想出来的问题,而是来自于企业的具体需求。

例如在广告战中,计算具体广告转化率,也就是打广告的效果。有多少人因为广告而购买了商品。在该需求中,可能涉及到多个企业。这是在企业合作中经常会出现的情况。

这个问题具有重要的实际价值,而且在很多场景下都需要,具有共性。

02

技术框架

上述问题咋看起来,很像隐私集合交集问题。注意PIS和PSI是两个问题。

PIS是一个密码学上的传统问题,即在不泄露交集的情况下,计算集合的交集。

而谷歌这里定义的PIS是除了PIS所完成的功能外,还能够对交集做聚合计算。显然这会带来额外的计算开销。

注意,聚合就是对同一属性的元素求和。

谷歌开源库做的事就是以PSI方案为基石,对其进行扩展。将其扩展为在不泄露交集的情况下,能够在相应的属性上做聚合计算。

所以该开源库的架构是:

PSI对交集元素求和

03

技术路线

该库的技术路线就是首先根据已有的PSI方案,选择出最有效的方案作为备选。然后通过加法同态加密实现聚合功能。

这些年,密码学界已经有许多PSI的解决方案。谷歌技术路线上选择了两种解决PSI问题的方法。

一种方法是基于随机不经意传输,该方法利用了不经意PRF技巧,获得了隐藏交集元素身份的功能。然后利用加法同态加密,实现了在不泄露交集元素的情况下提供聚合功能。

第二种方法是在加法同态加密下,利用加密的Bloom过滤器构造了一个oblivious协议。聚合功能依然通过加法同态加密实现。

除了以上两个协议外,还构造了第三个协议,称为DDH类型协议。该协议基于传统的集合交集协议,使用PohligHellman密文。这种类型协议可以看做是使用共享密钥的不经意PRF。同样,聚合功能也是通过加法同态加密实现。

04

性能

以上三个协议都需要加法同态加密。目前有三种加法同态加密方案:

1.Paillier加密方案

2.指数型ElGamal加密方案

3.环LWE加密方案

从通信效率和计算效率两个角度,谷歌对基于这三个加法同态加密的三个协议进行了详细分析。

数据显示,第三个协议--DDH类型协议获得了最好的通信效率。在输入集合元素是10万个元素情况下,只需要9.28M的通信量。

此外,在计算效率方面,基于环LWE加密方案的DDH类型协议也依然获得了最佳性能。在输入集合含有10万个元素,以及相关整数是32位的情况下,计算PIS问题仅需395.78秒。

对于其它两个协议,尽管做了计算上的优化,但是其计算瓶颈主要花在了同态操作上。

-----未完

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

区块博客

[0:15ms0-2:951ms