GAS:以太坊状态规模管理诸提议(下)_BenjiRolls

观点|以太坊状态规模管理诸提议

从状态树上移除vs.给状态树安排一个“退休”部分

另一个区分不同状态过期提议的技术角度是“一树流”和“二树流”。也就是说,我们到底是像现在这样,只有一棵状态树,只不过把某些状态标记为过期;还是直接把失活的状态从主状态树上移除,转移到另一棵专门的树上?

一树流

-激活节点以白色标记,失活节点以灰色标记-

注意,即使是树上的中间节点,也会被标记为激活或者失火;标记工作可以在状态树上的每个节点处完成。

二树流

-白色的树包含激活状态;灰色的树存储失活状态-

一树流的好处是,最起码,其工作方式看起来会跟当前的状态树相似,失活和复活的流程也比较简单:复活流程只需刷新树上相关节点的“过期日期”参数,而失活则是自动化的。但它的缺点在于:它需要一种能够在节点中以此种方式存储过渡信息的树结构,而且不能很好地扩展到Verkle树。此外,它还需要额外的默克尔证明元件,不仅要能够下沉到叶子节点,还要能够停在中间节点处。

二树流的好处是:当前的、形式纯粹的状态累加器就能支持这类方案,而无需为每个节点增加元数据。缺点是,它需要对整个协议做一些更深层次的变更,而且需要一个显式的流程来灭活状态。另外,它也没有为复活冲突两难提供内置的解决方案,所以需要在两种办法中作出选择。

注意,在二树流中,存储失活状态的数据结构不是非树不可。事实上,完全有可能出现这样一种设计:需要复活一个状态对象时,只需提供一个指向该对象失活时候收据的默克尔树,再附上一些密码学证据,证明此前该对象未被复活过,即可。

复活冲突

然后我们就到了状态过期方案的一个关键难题上:“复活冲突”。复活冲突的概念如下。假设某个账户由地址A生成;这个账户过期了;然后,地址A又创建了一个新的账户;最后,地址A再尝试复活那个最开始的账户。这时候会出现什么情况?

这里有几种可能的解决方案:

显式的“账户合并”流程:类似于规定“除了两个账户的ETH余额相累加以外,以旧账户的状态为准”或者“除了累加ETH之外,以新账户的状态为准”;甚至于,可以由旧账户的合约代码来规定特殊的合并流程

通过消除同一地址重复部署的功能来确保复活冲突不会发生:也就是调整CREATE2的功能,比如在最终哈希成地址的数据原像中包含当前时间,因此即使未来使用同样的数据来生成,也无法得到同样的地址

向状态对象增加一个“存根”,以防止在同一位置生成新账户

要求生成新账户时都必须附带该账户此前未过期的证明:某种意义上等价于存根方案,只不过这种办法是把存根放在状态的一个单独部分中,所以任何想要创建合约账户的用户都必须跟踪这部分状态

主要的担忧有:会给应用增加很多复杂性,他们需要加入合并的逻辑;这样做了之后,除非在链上“注册”一个地址,否则用户就没法再轻易获得可以与之交互、可以积累资产的地址了。未注册的地址是很重要的:任何第一次收到ETH的用户都是在使用一个尚未注册的地址。这第的担忧的根源是:未注册的地址实际上有了时间限制,如果用户生成了一个地址、收到了资金,但在接下来一年里忘了发送交易,那他的资金就会被锁住。

注意,EOA也不能幸免。虽然看起来能够,因为EOA的合并流程比较简单这样的方案。不过,这里也有两个问题。首先,账户抽象的目标是用合约来替代EOA,而账户抽象化的合约的合并流程可能并不简单。其次,会受过期和复活事件影响的不仅有EOA本身,还有该EOA所参与的应用中的相关存储键,所以还是需要复杂的合并逻辑。

因此,从我的角度来看,破坏性最小的是某种形式的存根方案。不过,存根方案里存在一个信息理论问题,会导致一些奇怪的结果。为了防止新的状态对象在N个已经过期的状态对象位置处创建,一个覆盖了这N个地址的集合必须是状态的一部分。如果这个集合是信息最小化的,那么这个集合的大小会是O(N),因此其状态规模也是O(N);那么,激活状态的规模就将与失活状态的规模成比例,所以实际上我们并没有解决这个问题。

Treerot

解决这个问题的唯一办法就是覆盖超过那N个账户的信息;实际上,我们将不得不让整棵树都变得不可访问)。

而这里还有一个问题:这产生了一种形式的“树发霉”,随着时间推移,对于新帐户的创建来说,状态树的所有部分都是不可访问的,至少对那些没有跟踪该区域过期状态的用户来说是这样的。

而树发霉导致的次生问题也必须解决。举个例子:如果一个合约要创建子合约,它必须能够在要么未发霉,要么用户具有见证数据的状态区域创建合约。树发霉问题的一个解决方案见此处:持续地开放状态的新区域以供账户创建。另一种思路是每个用户都选择状态的某些区域,跟踪该区域的变化以便能创建见证消息,并且只在该区域创建帐户。

树发霉的另一个问题是,它需要一个显式的数据结构来存储和检查范围。如果一棵树有能够放在节点中、指明该节点以下的哪些部分已经过期的数据,那是最好的,但一个键值对存储要做到这一点还是相当有难度的。

回头再看强无状态性

在状态过期方案中使用树结构所产生的许多问题,都可以被追溯到这样一个事实:我们需要对哪些状态是活跃的、哪些状态是失活的,达成共识。在二树流模式中,这一点更加明显;但即使是在一树流模式中,状态树上也需要有显式的标记,以便近期使用快速同步下载了状态的以太坊节点能够确定一笔尝试访问某个账户、但又没有提供见证消息的交易,应该成功还是失败。那我们能不能做到不需要明确这个区别呢?

如果我们实现了完全的无状态性,然后能帮助交易发送者和区块生产者可靠地获得见证消息生成所需的状态,不就解决这个问题了吗?那什么办法能帮助交易发送者和区块生产者做到这些呢?

一种自然而然的办法是:网络中的节点都仅保存状态树的一部分,例如,在过去一年中访问到的那部分。只需在客户端设定中加入一个自愿的设定即可。如果我们想要更可靠一些,我们可以通过引入一种proofofcustody方案,强制至少矿工存储一些数据。

有一点需要注意:如果共识层不能感知哪些状态是活跃的、哪些状态是失活的,那访问近期状态和老旧状态的Gas开销就是一样的。这会导致两个结果:

访问近期状态的Gas开销也需要进一步提高

包含了见证消息的区块大小上限可能非常之大,如果一个区块里满是访问老旧状态的事务的话

如果我们想避免这些不利因素,就需要在共识中跟踪哪些状态对象是活跃状态,这又会让我们回到接近于状态过期方案的属性。这再一次地说明了,“无状态性vs.状态过期”是一条光谱,是一个复杂的权衡空间,而不是一个非此即彼的选择。

Rollup也需要,也可以,使用同样的解决方案

以太坊的一种重要的中期可扩展性解决方案是rollups。不过,rollup本身并非不再需要担忧状态数据规模问题;实际上,rollup系统的状态规模问题,与以太坊链本身的,性质完全相同。

幸运的是,如果我们能推出一种解决方案,则至少EVMrollup能够使用同样的解决方案,来解决其内部状态的规模问题。因此,状态规模管理方案,与rollup和分片等可扩展性方案是互补的。

结论

状态规模是一个日益恶化的问题,而状态规模的解决方案也能为大幅提高区块Gas上限铺平道路。我们应该对某种形式的状态过期方案达成共识并加以实现。不过,不同的解决方案之间存在重大技术权衡,尤其如果我们还想要保持当前设计的一些重要属性的话。

一些我们可能需要牺牲的属性包括:

用户可以离线生成账户并以该地址接收资金、并且在使该地址在链上显明之前可以静默任意时长的属性

地址保持20字节的长度

状态可以被视为“纯粹的”键值对存储的属性,以及无需在状态树上每个节点内存储元数据的属性

现有的应用需要程度不等的重写,以保证用户无需存储全部失活状态就能生成见证数据

Gas消耗量;或者创建新合约、写入新存储槽的难度

我们如果已经准备好作出牺牲,有些方案可以很快开始着手实现。另一方面,也许假以时日,我们能修补或者更好地汇总这些观念,减少问题,尤其是使它们在技术上更容易实现。我们应该更深入地理解我们更愿意/更不愿意接受哪些方面的牺牲,并继续积极研究改进提案。

原文链接:

https://hackmd.io/@HWeNw8hNRimMm2m2GH56Cw/state_size_management

作者:?VitalikButerin

翻译:?阿剑

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

区块博客

[0:15ms0-3:787ms