Vitalik: 基尼系数在非地缘社区里使用是有问题的,不应过度使用基尼系数

基尼系数(也被称为基尼指数)是迄今为止最受欢迎、最广为人知的用于测量收入不平等的标准,特别是用来衡量在某国家、地区或其他社区的收入或财富不平等。它之所以受欢迎,是因为它很容易理解,它的数学定义可以很容易通过一个图表进行可视化。然而,人们可以想象,任何试图把不平等简化为一个数字的方案都会有局限性,基尼系数亦如此。即使在它一开始用于测量各国的收入和财富不平等的语境下,它也是有局限性的,而当把基尼系数挪用到其他语境(特别是加密货币世界)时,其局限性则更明显了。在这篇文章里,我将谈论基尼系数的局限性,并提议使用其他替代方案。什么是基尼系数?基尼系数是由科拉多·吉尼(CorradoGini)于1912年提出,用于测量不平等。它通常被用来测量国家的收入和财富的不平等,尽管它越来越多地被用于其他语境。基尼系数有两个等值定义:?用曲线上的面积定义:绘制函数图,其中,f(p)等于低收入人群赚取的总收入(即f(0.1)代表收入最低的10%的人在总收入中的份额)。Gini系数是该曲线与直线y=x之间的面积,是整个三角形的一部分:

?用平均差值定义:基尼系数是所有可能的每两人之间收入的平均差值的一半再除以平均收入。例如,上面例子的图里,四个人的收入是,因此有16个可能的差值,它们是。由此得到平均差值为2.875,而平均收入为3.75,因此基尼系数=2.8752/(2*3.75)≈0.3833。结果是两者的数值是相等的(证明这一点就当是读者的一个练习)!基尼系数有什么问题?基尼系数很有吸引力,因为它是相当简单且易于理解的数据。它可能看起来不简单,但相信我,几乎所有处理任意规模人口的统计数据都那么糟糕,且往往更遭。请看看像标准差一样基础的公式:

《华尔街日报》:Binance.US的首次交易涉及洗售交易:金色财经报道,《华尔街日报》7月24日称,Binance.US的部分首批加密货币交易是在内部进行的,构成洗售交易。《华尔街日报》称,Binance.US在2019年运营的第一个小时内就发生了价值70,000美元的比特币交易。但根据一份内部备忘录,币安首席执行官赵长鹏在谈到这些交易时表示,我认为那是我们自己的交易。

除了引用该备忘录之外,《华尔街日报》还描述了SEC针对该公司正在进行的案件。美国证券交易委员会的案件对虚假交易提出了类似的指控,称Binance.US通过CZ控制的公司(例如Sigma Chain)的账户夸大了交易量。《华尔街日报》重点介绍了该案的一个部分,其中SEC声称Sigma Chain账户和高管账户之间的洗盘交易占一种加密货币交易量的70%。[2023/7/25 15:57:13]

而基尼系数是:

这真的很简单的,我保证!那么,它有什么问题呢?它其实有很多问题,人们已经写了很多关于基尼系数各种问题的文章了。在本文,我将重点讨论一个我认为在整个基尼系数领域讨论还不足的一个问题,但它与分析在互联网社区(例如区块链)里的不平等特别相关。基尼系数将两个实际上非常不同的问题——由于缺乏资源而遭受痛苦与权力集中——结合到一个不平等指数里。为了更清楚地理解两个问题的差异,我们来看看两个反乌托邦:反乌托邦A:一半人口平分所有资源,其他人一点都分不到反乌托邦B:一个人拥有所有资源的一半,其他人平均分剩下的一半资源以下是两个反乌托邦的洛伦兹曲线(像我们在上文看到的一样好看的图表):

《华盛顿邮报》:检察官在讨论与币安达成和解的可能性:金色财经报道,针对此前披露美国联邦检察官正在审查币安与美国对冲基金的交易,《华盛顿邮报》称两位知情人士透露位于西雅图的华盛顿西区美国检察官办公室其实已经在几个月前就发出了传票,只是之前没有被报道过,而且这也不一定意味着监管机构会对币安提出指控,因为需要权衡是否有足够的证据起诉,同时检察官仍在讨论与币安达成和解的可能性。

币安表示遵守所有美国法律,并协助执法机构进行调查,最近币安在合规计划上投入大量资金并与执法部门密切合作开发了在其平台上抓捕犯罪分子的新技术。此外,几家专注于加密货币的大型美国对冲基金也已经表示要么不使用币安,要么仅在Binance.US上拥有账户。[2023/1/8 11:01:11]

显然,这两个反乌托邦都不是适合生活的地方。但它们不适合生活的原因并不相同。反乌托邦A等于给每个居民一个抛硬币的机会,如果落在左边,面对的是可怕的大规模饥饿;如果落在右边,则是和平等主义带来的和谐。如果你是灭霸,你可能会喜欢它!如果你不是,应该以最强的力量避免其发生。另一方面,反乌托邦B类似于“美丽新世界”:每个人都有体面的美好生活(起码在对每个人的资源进行快照时是这样),但这是以一个极其不民主的权力结构作为代价的,你最好希望你有一个好的统治者。如果你是柯蒂斯·雅文(译者注:美国极右派博客作者),你可能喜欢。如果你不是,也应该以最强的力量避免其发生。这两个问题相差甚远,值得分开分析和测量。这个差异不只是理论上的。以下这个图表展示了底层20%的人的收入在总收入的占比(这是避免反乌托邦A的一个合适的指标)与顶层1%的人的收入在总收入的占比(这是接近反乌托邦B的一个合适的指标)的对比:

《华尔街日报》:币安的财务状况仍然是“一个谜”:金色财经报道,根据《华尔街日报》最近的一篇报道,尽管币安最近努力提高透明度,但它的财务状况仍然是个谜。??本周早些时候,审计公司 Mazars 发布了一份“审计”报告,指出该交易所的储备已完全抵押。中心化交易所的用户持有约 97 亿美元,比特币储备率达101%。然而,上市公司会计监督委员会 (PCAOB) 前首席审计师Douglas Carmichael表示,Mazars报告实际上并未回答有关资金是否得到充分抵押的问题。?Mazars也没有表达“保证结论”,这意味着这些数字可能不完全准确。没有关于交易所总资产和总负债的信息。?[2022/12/12 21:37:45]

来源:https://data.worldbank.org/indicator/SI.DST.FRST.20(合并了2015年和2016年的数据)和http://hdr.undp.org/en/indicators/186106.两者明显是相关的(相关系数是-0.62),但远非强相关(统计学的权威显然认为0.7是“高度相关”的较低阈值,而我们得出的数值比它还低)。图表中有一个有趣的第二个维度可以分析——顶层1%的人赚总收入的20%而底层20%的人赚3%的国家与顶层1%的人赚总收入的20%与底层20%的人赚总收入7%的国家有何差异?唉,这种探索最好还是留给其他比我更有经验、更进取的数据与文化探索者吧。为什么基尼系数在非地缘社区里使用(例如互联网或加密社区)是非常有问题的在区块链世界里,财富集中是一个特别重要的问题,且是一个值得测量和理解的问题。这对整个区块链世界很重要,因为很多人(和美国参议院听证会)正试图搞清楚加密货币在多大程度上是真正反精英主义,以及在多大程度上它只是用新精英取代旧精英。这一点在对比不同加密货币时也非常重要。

《华尔街日报》:马斯克须向三名被解雇的推特高管支付逾2亿美元遣散费:10月28日消息,据外媒报道,推特提交给美国证券交易委员会(SEC)的文件显示,马斯克在周四晚间通过440亿美元收购案正式接管这家社交网络后便解雇了其首席执行官Parag Agrawal、首席财务官Ned Segal和法务政策主管Vijaya Gadde。然而这三人享受收购交易中的“金色降落伞”条款,因此马斯克须向这三人支付逾2亿美元的遣散费。

此外,据报道,Agrawal、Segal和Gadde共计拥有大约115万股Twitter股票,其中一半以上为Gadde所有,价值达3380万美元。马斯克将像购买任何其他股东的股票一样,购买这三人所持的价值约6200万美元的股份。(《华尔街日报》)[2022/10/28 11:52:14]

在加密货币的初始供应量中,部分代币直接分给特定内部人员是不平等的一种。请注意,以太坊的数据是稍有问题的:内部人员和基金会的占比应该是12.3%和4.2%,而不是15%和5%。考虑到对这些问题的关注,很多人都尝试计算加密货币的基尼指数,这应该一点都不奇怪:受关注的质押EOS代币的基尼指数(2018)加密货币的基尼系数(2018)使用多个指标和粒度来测量比特币和以太坊的去中心化程度(2021,包括基尼系数和其他两个指标)NourielRoubini将比特币的基尼系数与朝鲜进行对比(2018)加密货币市场上的链上深入观察(2021,使用基尼系数来测量中心化程度)而且在比这更早的时候,我们从2014年起就必须应对这篇轰动一时的文章:

《华盛顿邮报》:美参议员提案允许加密公司访问美联储支付渠道:金色财经报道,据《华盛顿邮报》消息,最近有人发现美国共和党参议员 Cynthia M. Lummis 和民主党参议员 Kirsten Gillibrand 此前共同提出《负责任金融创新法案》(Responsible Financial Innovation Act)中有一条鲜为人知的条款,允许加密公司在美联储获得账户,这些账户持有人可以访问美联储的支付系统,允许他们在不涉及与独立银行接触的情况下为客户结算交易。

据一些金融监管机构和专家表示,该措施的影响将波及整个行业及其他领域。此前,美联储一直不愿将主账户授予以加密货币为重点的银行,过去两年,Custodia Bank 和 Kraken Financial 两家公司都未能获得美联储的主账户,而这两家公司均获得了 Cynthia M. Lummis 的支持。[2022/7/4 1:48:56]

这类分析除了经常犯一般方法论错误(通常要么把收入与财富混为一谈,要么把用户与账户混为一谈)外,它们在使用基尼系数来做这些类型的对比也有一个严重而微妙的问题。这个问题在于典型地缘社区(例如城市、国家)与典型互联网社区(例如区块链)之间的关键区别:一个地缘社区的典型居民会在这个社区上花费他们大部分的时间和资源,因此在一个地缘社区中测量的不平等反映的是人们可获得的总资源的不平等。但在互联网社区里,测量不平等可以有两个来源:(i)不同的参与者在总资源里获得的不平等份额,以及(ii)参与社区的兴趣水平的参差。拥有15美元法币的普通人是贫穷的,他们没有获得美好生活的能力。有价值15美元的加密货币的普通人是一个业余爱好者,他开钱包是为了好玩。兴趣水平参差是健康的;每个社区都有其业余爱好者和没有生活的全职硬核粉丝。因此,如果一个加密货币有非常高的基尼系数,但不平等的很大部分原因是由于兴趣水平的参差,那么这个数字指向的现实远没有那些头条意指的可怕。加密货币,即使是那些已经高度由财阀控制的,也不会把世界的任何地方变为接近于反乌托邦A那样。但分配很糟糕的加密货币可能看起来像反乌托邦B,如果使用代币投票治理来做协议决策的话,问题会变得更复杂。因此,为了找出加密社区最令人担忧的问题,我们想要一个可以反映接近于反乌托邦B的、更具体的指标。替代指标:分开测量反乌托邦A和反乌托邦B的问题测量不平等的另一个方法是预估由资源的不平等分配带来的苦难(即“反乌托邦A”的问题)。首先,从某效用函数开始,它代表具有一定数量钱的价值。很多人使用log(x),因为它能非常直观地表现一个人收入翻倍的近似值,且在任何水平上都是有效的:从10,000美元变成20,000美元增加的效益与从5,000美元变成10,000美元、或从40,000美元变成80,000美元是一样的。然后,得出的是与如果每个人只能得到平均收入相比,测量损失了多少效用:

第一项(平均数的对数)是货币得到完美分配的情况下每个人会得到的效用,因此每个人都会赚取平均收入。第二项(对数的平均值)是今天经济体的平均效用。如果你把资源狭义地看作是用于个人消费的东西,两项的差值代表不平等带来的效用损失。还有其他方法可以定义这个公式,但它们最终都接近于等值(例如,安东尼·阿特金森(AnthonyAtkinson)1969年的论文提出一个“公平分配的均衡收入水平”指标,在U(x)=log(x)里,它只是上述公式里的一个单调函数,而Theil指数L则在数学上与上述公式完全相等)。而要测量资源集中问题(或“反乌托邦B”问题),赫芬达尔——赫希曼指数(简称为HHI)是一个很好的起点,它已经被用来测量行业里的经济集中程度了:

对于喜欢通过可视化来学习的读者,可看下图:

HHI:绿色面积除以总面积它还有其他替代指标;戴尔指数T(TheilTindex)跟它有一些相似性,但也有不同。一个更简单、更笨的替代指标是Nakamoto系数:最小需要加起来的参与人数要大于总人数的50%。请注意,这个所有这些集中指标都非常关注在顶部附近发生的情况(而且是故意的):大量拥有少数资源的业余爱好者对这个指数贡献很少,甚至没有贡献,而顶部两个参与者的行为合起来可以对这个指标产生非常大的影响。对于加密社区,资源集中对系统来说是最大风险之一,但只有0.00013个代币的人并不能证明他们正在挨饿,但采用这些指数就是这样的思路。但是,即使对于国家,权力集中与因缺乏资源而受苦这两件事也应该分开来谈论和测量。也就是说,某种程度上我们必须超越这些指标。集中问题带来的伤害不只是一个关于行动者数量大小的函数;它很大程度上还取决于行动者和他们互相合谋的能力。同样地,资源分配是依赖网络的:如果缺乏资源的人有一个非正式网络可以进入,那么缺乏正式资源也不是那么有害。但处理这些问题的难度大得多,因此在我们仍有较少数据可以利用时,我们确实还需要更简单的工具。原地址:https://vitalik.ca/general/2021/07/29/gini.html

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

区块博客

[0:46ms0-5:102ms