科普|如何开发出好用的轻客户端,Part-1
科普|如何开发出好用的轻客户端,Part-2
大多数钱包软件都依赖于Infura等中心化提供商。如果我们想要别出心裁一些,就需要开发一个可以在低资源设备上运行的新型轻客户端。
在本文中,我们将介绍以太坊状态是什么,以及如何让轻客户端轻而易举地获得它。
以太坊状态
当我们提到“状态”时,我们指的是所有账户信息以及所有存储在智能合约中的数据。目前,状态包括:
1.32亿个账户大约10GB的账户数据大约30GB的合约storage数据大约60GB的Trie节点经常性数据我们先来看一下客户端目前是如何访问状态的。
同步
以太坊节点需要访问完整的状态才能处理新挖出的区块。我们可以通过执行从创世块开始到链首块的每个区块来从头计算出状态。通常情况下,我们不会采用这个方法,因为计算成本太高。
客户端倾向于直接从其它完全同步的客户端那里获取完整的状态副本。虽然不同的客户端执行该操作的具体方式不同,但无论是哪种客户端,在首次上线或离线一段时间后再次上线的情况下,通常都要花费一段时间同步至最新区块。
徐明星新书《趣说金融史》正式发布 科普金融发展之道:金色财经现场报道,9月23日,欧科云链创始人徐明星携手著名财经作家李霁月、行业观察者顾泽辉力作《趣说金融史》一书,跨越5000年金融历史,重读金钱故事,并预测新的金融时代。该书由中信出版社出版,将于近期正式发售。据了解,本书可以更好地呈现金融的起源与发展,帮助人们理解货币、金融与未来经济。作为区块链行业领军企业——欧科云链的创始人,徐明星深知技术探索对经济社会的重要推动作用,他曾先后出版过《图说区块链》、《区块链:重塑经济与世界》、《通证经济》、《链与未来》等行业权威著作,解读区块链等新型技术的推动下,金融与社会的升级之道,对经济社会发展做出了重大贡献。其中,《区块链:重塑经济与世界》曾作为新中国70周年重点推荐图书之一被相关书店推荐。[2021/9/23 17:00:57]
同步可能需要花费很多时间。如果你使用自己的节点与区块链交互,这会是一大缺陷。要让客户端一直保持同步状态,你不仅需要花时间等待客户端同步,还需要消耗计算机的计算和存储资源。
我们的解决方案是专门针对资源受限的设备而设计的,可以一举解决上述两个问题。我们的轻客户端在运行时只需消耗最少的CPU/RAM/HDD/带宽资源,而且可以保证永远在线。
动态 | 报告:区块链等热点词促使童书科普百科类成交额同比增速最高:近日,京东图书与艾瑞咨询联合发布了《2019中国图书市场报告》。报告指出,AI、5G、区块链、机器人、VR、智能家居、AR这些热点词,不断点燃科技热潮,科技在改变大众生活的同时,也吸引了越来越多家长的关注,从小培养孩子对科技的兴趣和热爱。因此童书中科普百科类成交额同比增速最高,占比将近40%。[2020/1/8]
当然了,不同的设备之间存在差异,甚至有可能出现无法承受基础负载的情况。为了应对这一情况,我们正在努力免去完全同步的需求。在我们设计的模型下,客户端只需要准确获得链首块的信息即可。
我们的最终目标是构建一个在首次安装或离线一段时间后再次上线能够立即使用的客户端。这个客户端只需能访问正确的数据即可。
按需状态可得性
在如今的DevP2P以太坊协议中,有一个名为GetNodeData的消息。它可以用来检索以太坊状态的任意部分。我们已经在Trinity中使用该网络消息来开发“Beam”同步模式并证明了其可行性。这是我们进行的基础研究之一,旨在证明这种新型轻客户端是可以实现的。
动态 | 新浪财经:官媒针对区块链的报道从科普宣传转向打假监管:据新浪财经今日消息,“1025新政”满月,一个月间,官媒对区块链的态度风向已转。据11月初的一项统计,七家党媒在新政一周内发布了65篇直接相关报道,当时文章中的关键词是数据、产业、安全、创新等,大量文章偏向于科普区块链的概念以及应用介绍,提醒警惕虚拟货币炒作的仅有3篇。近期,官媒的批评焦点则纷纷指向借区块链之名进行的虚拟货币发行和炒作行为。据统计,新华网、人民网收录转载的,以打击虚拟货币或揭露假借区块链行为主题的文章,自10月25日到11月25日午间,共28篇;其中,11月19日至11月25日的一周内就高达15篇。这些文章主要围绕三个观点展开:厘清区块链和虚拟货币的关系,说明二者概念不等;打击伪“区块链”局,或是虚拟货币局揭露;提醒民众,区块链不能成为炒作的噱头,更不是行的招牌,需警惕此类活动,理性投资。[2019/11/26]
遗憾的是,当前的DevP2P以太坊网络并不合适用于轻客户端用例,因为它需要每个节点都能存储超过40GB的状态数据,并提供状态的任意部分。无法响应这些状态数据请求的节点不太可能维持健康的对等连接。
声音 | 浪潮集团云南分公司总经理:云南区块链产业发展需从“科普”到“专精”不断深化:据昆明日报消息,浪潮集团云南分公司总经理郑昕表示,云南区块链产业发展需从“科普”到“专精”不断深化。下一步,浪潮将继续加大云南农业产业高质量发展体系建设力度,重点以普洱茶等云南优势产业为切入点,打造云南“绿色、有机农产品高地”的品牌形象,并在此基础上,开展基于区块链的供应链金融服务,解决中小企业贷款难、贷款贵问题。[2019/11/11]
按需状态访问模式
当前网络的设计是同步完整状态。GetNodeData消息适合我们的按需状态检索实验只是一个巧合。为了让客户端能够同步完整的状态,高效的访问模式是按顺序遍历数据,获得连续的大数据块。然而,在钱包用例以及我们的新型轻节点用例中,访问状态的需要需要很大程度上是随机的。
钱包访问状态的主要方式是通过以下JSON-RPC方法:
eth_getBalance用来检查账户余额eth_call用来查询合约数据eth_getTransactionCount和eth_estimateGas用来构建交易eth_getBalance和eth_getTransactionCount仅从主要账户Trie中读取值。因此,可以通过调用该方法获得Trie上现有的1亿多个账户中任意一个地址的情况。
动态 | 央行官微旧文重发“再科普”:范一飞详解数字货币:据中国经济网消息,今日,央行官微公众号头条重新发布央行副行长范一飞在2018年1月25日题为《关于央行数字货币的几点考虑》的文章,对央行数字货币再次进行科普。同时,微信公众号第二条发布支付司副司长穆长春8月10日在第三届中国金融四十人伊春论坛上的演讲。近年来,各主要国家和地区央行及货币当局均在对发行央行数字货币开展研究,新加坡央行和瑞典央行等已经开始进行相关试验,人民银行也在组织进行积极探索和研究。[2019/8/21]
eth_call和eth_estimateGas都涉及实际的EVM执行。EVM执行可以从1亿多个账户中的任意一个及其底层合约存储Trie中读取数据。
我们发现,钱包只需读取少量数据,而且读取的需要是随机的。这在根本上与同步完整状态不同,因此这两个用例不太可能通过同一个解决方案来解决。
我们需要解决的问题
新的网络需要解决当前网络存在的一些缺陷。
如何分担并降低存储压力
这个网络上的节点要能为存储完整状态贡献少量存储空间。我们想让网络中的每个节点存储一小部分状态,而非完全复制所有状态。有了足够多的节点,整个网络就可以轻而易举地以极高的复制因子存储所有状态。
如何找到你需要的状态
由于每个节点只需存储小部分状态,我们再也不能盲目地向网络中的任意节点请求数据。因此,网络需要一个节点发现机制,以便节点获取所需数据。
如何确保数据永远是最新的
不同于可以构建成只能添加型文件的区块链历史记录,以太坊状态是持续变化的。每个交易都会导致账户余额和合约存储发生变化,这些更新需要在网络中广播。
如何从网络中读取数据
重要的是,客户端要能高效地从网络中读取数据。调用eth_estimateGas将根据最新的状态根预测执行交易,来确定交易需要消耗的gas。如果是一个只涉及两个账号的简单转账交易,所需的数据量相对较小。然而,如果是与智能合约交互并且需要用到合约存储的复杂交易,客户端需要从数据库读取的数据量则大得多。
假设一次网络往返需要100ms,那么一笔需要100个状态部分的交易需要花费大约10秒时间来估算gas使用量。如果延迟太久,一些操作可能需要花费过多时间才能完成,这会大幅降低网络的可用性。
如何解决合约存储失衡问题
账户Trie在设计上是平衡的,但合约存储不是。这就导致合约存储很难处理。
潜在解决方案
人们正在积极研究按需状态可得性。目前,我们还不清楚该研究的未来方向,但是我们目前主要聚焦于两个不同的方法。
GetNodeData风格的原生KademliaDHT
我们可以采用的最简单的解决方案之一就是,采用与GetNodeData相同的运作方式,但是仅要求每个节点存储距离自己最近的数据,而非所有数据。Trie上的每个节点都有一个哈希值,我们可以使用这些哈希值将Trie数据与DHT键空间关联起来。你可能还记得,KademliaDHT网络有一个新特性:遍历键空间只需O(log(N))。
这个方法的缺陷在于效率和速度。存储由单个节点哈希哈希作为键的Trie数据需要存储大量中介Trie节点,这会导致网络需要存储的数据总量翻倍。
这个方法也会让数据检索变得低效。通过该结构查找数据时,你必须从状态根开始遍历Trie节点。对于账户Trie来说,这平均需要7次查询,才能获得实际的账户数据。
这个方法确实具有很大的优势。它彻底避开了合约存储失衡问题,因为各个Trie节点的哈希值是随机的,因此数据会自动呈随机分布。再进一步来看,如果网络大到足以存储完整的6TB存档历史,这个网络最终将变成一个归档节点。
这个方法的另一个主要优势是,可以免去对证明的需求。我们直接构建Trie和所有中间节点,因此无需相关的默克尔证明。
目前,我们正在努力确定这个方法是否能够达到性能要求。
叶子节点和证明
另一个方法是将Trie的叶子节点组成共享同一条基础路径的连续的块。各个节点会存储KademliaDHT网络中离自己最近的Trie路径“周围”的所有叶子节点。对于高度平衡的账户Trie来说,这个方法非常有吸引力。
通过Trie路径处理数据,我们无需遍历Trie,访问叶子数据的复杂度将下降到O(1)。如果你还记得的话,GetNodeData风格的原生方法平均需要7次网络往返,才能访问存储在Trie叶子节点中的数据。然而,本节所介绍的方法在性能上的优势非常重要,而且是实现网络可用性必不可少的。
这个方法的优势也是有代价的。确保数据是最新的会极大提高复杂性。有很多方法可以做到这点,但是每个方法都有权衡取舍。虽然数据可以就地更新,但是这需要每个节点都进行昂贵的计算。或者,每次挖出一个新的区块后,更新后的证明都会广播至全网节点。这些方法都在计算和带宽之间进行了权衡取舍。但无论是计算还是带宽,这两个在我们眼中都是稀缺资源。
我们的研究结果将指明我们的新网络要采取的发展方向。
本系列的下一篇文章应该是最后一篇介绍性的材料。我们将检视这种新型的客户端实际长什么样,以及我们如何理解它的使用方式。我们将提供概要的路线图,说明我们将如何实现它;以及,我们所做的一切与“无状态以太坊”有何关联。
原文链接:https://snakecharmers.ethereum.org/the-winding-road-to-functional-light-clients-part-3/作者:PiperMerriam翻译&校对:闵敏&阿剑
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。