ERA:Web3 的阴暗面:去中心化如何助长 AI 偏见_etherark

原文:venturebeat 

编译: DeFi 之道, Kyle 

人工智能 (AI) 迅速改变了我们的生活和工作方式。与此同时,AI 数据偏见带来的挑战已经走到了最前面。当我们走向 Web3 的未来时,我们自然会看到同时使用 Web3 和 AI 的创新产品、解决方案和服务。而且,虽然一些评论员认为去中心化技术可以解决数据偏见问题,但事实并非完成如此。

图片来源:由 Maze AI 生成

Web3 市场规模仍然相对较小且难以量化,因为 Web3 生态系统仍处于发展的早期阶段,Web3 的确切定义仍在不断发展。虽然 2021 年的 Web3 市场规模估计接近 20 亿美元,但各种分析师和研究公司报告称,预计复合年增长率 (CAGR) 约为 45%,再加上 Web3 解决方案和消费者采用率的快速增长,到 2030 年,Web3 市场的价值将达到 800 亿美元左右。

以太坊侧链SKALE与Web3社交平台OIX达成合作:5月6日消息,以太坊侧链SKALE与Web3社交平台OIX达成合作。通过此次合作,OIX可以为用户提供无成本、高性能的交易,从而提升用户体验和可扩展性。据悉,OIX支持来自图像、视频、音频和3D的内容,包括增强现实和虚拟现实,并提供七种语言版本。通过其适合移动设备的社交信息源,用户可以连接、社交、互动和交易所有类型的数字资产,而无需支付任何市场费用。[2023/5/6 14:46:58]

虽然 Web3 正在快速增长,但该行业的现状与其他科技行业因素相结合是 AI 数据偏见走上错误道路的原因。

数据偏见、质量和数量之间的联系

AI 系统依靠大量高质量数据来训练它们的算法。OpenAI 的 GPT-3(包括 ChatGPT 模型)在大量高质量数据上进行了训练。OpenAI并未透露用于训练的确切数据量,但估计在千亿字量级或更多。

万代南宫梦旗下Web3元宇宙基金投资游戏工作室SuperGaming:金色财经报道,日本游戏发行商万代南宫梦(Bandai Namco Entertainment)已使用Web3元宇宙基金其“Bandai Namco Entertainment 021 Fund”投资了与谷歌云合作的游戏工作室SuperGaming,万代南宫梦在一份声明中称本次投资将使其进一步扩大亚洲IP市场业务。虽然本次投资没有对外公开披露金额,但该基金通常的投资规模在1000万日元到5亿日元。Bandai Namco Entertainment 021 Fund基金成立于去年4月,主要支持构建“IP元宇宙”的初创公司,前期还投资了提供AI驱动的动作捕捉和实时身体跟踪数字角色解决方案DeepMotion。(samacharcentral)[2023/3/19 13:13:21]

数据经过过滤和预处理,以确保其质量高且与语言生成任务相关。OpenAI 使用先进的机器学习 (ML) 技术(例如 Transformer)在这个大型数据集上训练模型,使其能够学习单词和短语之间的模式和关系,并生成高质量的文本。

Web3出版平台Matters Lab与Mask Network达成合作:官方消息,Web3出版平台Matters Lab与Mask Network达成合作,Travelogers的所有者可以在Twitter上以个人资料图片的形式展示他们的Travelogers NFT。

此前消息,Web3出版平台Matters Lab发行的社交共创型NFT数字头像Traveloggers首批300个盲盒在10分钟内售罄。Matters Lab将在11月12日向Matters.news的社区用户空投另外300个Traveloggers,其余Traveloggers将从11月15日开始在OpenSea上公开发售。[2021/11/12 21:46:39]

AI 训练数据的质量对 ML 模型的性能有重大影响,数据集的大小也是决定模型泛化到新数据和任务能力的关键因素。但是,质量和数量都会对数据偏见产生重大影响,这也是事实。

Web3数据生态系统Pocket Network通过代币公开销售筹资930万美元:4月29日,Web3数据生态系统Pocket Network发推宣布通过代币公开销售筹资930万美元,投资者包括BlockArk、OKEx、ZEEPrimeCapital、FreeCompany、DACM、LDCapital、Apollo、EdenBlock、Blockchain.com、Republic、FBGCapital、DIVERGENCE、RedBlock、atkc、CMS、MechanismCapital、BorderlessCapital、DFG、FacultyCapital、DecentralPark以及其他200余个节点运行商。[2021/4/29 21:11:28]

数据偏见的独特风险

掌柜调查署 | Buster:分片技术的发展让Web3.0的基础设施更加扎实:在今日举行的《掌柜调查署 | Near分片技术如何引领web3.0时代》直播中,Buildlinksojwr合伙人、Near中国首个大使Buster表示,分片是数据库领域中存在了很久的一个概念,可以帮助信息系统水平扩展性能。区块链使用分片的理念进行扩展是情理之中的。NEAR的创始人之一Alex之前就开发过可商用的分片数据库系统,在这方面有可沿用的经验,这使得NEAR的分片设计与工程实现相比其他项目有一定的优势。分片技术之所以是大方向,是因为区块链要有更大规模的使用,性能的提升是绕不开的。提升单条链的性能是有极限,而且通常是不经济的。因此要扩容区块链也是通过分片和优化分片性能的方式为最好。分片技术的发展让Web3.0的基础设施更加扎实,这从长远来看是非常重要的。

性能就是未来开放网络的马力,而NEAR就是发动机,有了好的发动机,别的零部件改改都不是大事。[2020/8/14]

AI 中的数据偏见是一个重要问题,因为它可能在就业、信贷、住房和刑事司法等领域导致不公平、歧视和有害的结果。

2018 年,亚马逊被迫废弃了一款显示出对女性有偏见的 AI 招聘工具。该工具接受了对过去 10 年期间提交给亚马逊的简历的培训,其中主要包括男性候选人,导致 AI 减少了包含“女性”和“女人”等词的简历。

2019 年,研究人员发现,一种用于预测患者预后的商用 AI 算法对黑人患者存在偏见。该算法主要针对白人患者数据进行训练,导致其对黑人患者的假阳性率更高。

Web3 解决方案的去中心化性质与 AI 相结合,带来独特的偏见风险。这种环境中数据的质量和可用性可能是一个挑战,这使得准确训练 AI 算法变得困难,这不仅是因为缺乏使用中的 Web3 解决方案,还因为缺乏有能力使用它们的人群。

我们可以从 23andMe 等公司收集的基因组数据中得出相似之处,这些数据对贫困和边缘化社区存在偏见。23andMe 等 DNA 检测服务的成本、可用性和目标营销限制了来自低收入社区或生活在该服务未运营地区的个人获得这些服务的机会,这些地区往往是较贫穷、欠发达国家。

因此,这些公司收集的数据可能无法准确反映更广泛人群的基因组多样性,从而导致基因研究以及医疗保健和医学发展的潜在偏差。

这让我们想到了 Web3 增加 AI 数据偏见的另一个原因。

行业偏见和对道德的关注

Web3 创业行业缺乏多样性是一个主要问题。截至 2022 年,女性占据了 26.7% 的技术职位。其中,56% 是有色人种女性。科技行业的高管职位中女性比例更低。

在 Web3 中,这种不平衡加剧了。根据各种分析师的说法,只有不到 5% 的 Web3 初创公司拥有女性创始人。这种多样性的缺乏意味着 AI 数据偏见很可能被男性和白人创始人无意识地忽视为一个问题。

为了克服这些挑战,Web3 行业必须在其数据源和团队中优先考虑多样性和包容性。此外,该行业需要改变为什么多样性、平等和包容是必要的故事。

从财务和可扩展性的角度来看,从不同角度设计的产品和服务更有可能为数十亿客户服务,而不是数百万客户,这使得那些拥有多元化团队的初创公司更有可能获得高回报和全球规模的能力。Web3 行业还必须关注数据质量和准确性,确保用于训练 AI 算法的数据没有偏见。

Web3 能否解决 AI 数据偏差问题?

应对这些挑战的一种解决方案是开发去中心化的数据市场,允许个人和组织之间安全、透明地交换数据。这有助于降低数据偏差的风险,因为它允许在训练 AI 算法时使用更广泛的数据。此外,可以利用区块链技术保证数据的透明性和准确性,使算法不产生偏见。

但是,最终,在主流受众使用 Web3 解决方案之前,我们将面临多年寻找广泛数据源的重大挑战。

虽然 Web3 和区块链继续出现在主流新闻中,但此类产品和服务最有可能吸引初创企业和技术社区的人们——我们知道这些社区缺乏多样性,但在全球市场中所占的份额相对较小。

很难估计在 Web3 初创公司工作的世界人口的百分比。近年来,该行业在美国创造了大约 300 万个工作岗位。如果将这一数字与美国总人口相比——并且不考虑失去的工作岗位——这个科技行业远不能代表适龄工作的公民。

在 Web3 解决方案变得更加主流并将其吸引力和使用范围扩大到那些对技术具有内在兴趣并变得负担得起并且足以被更广泛的人群使用之前,获得足够数量的高质量数据来训练 AI 系统仍然是一个重大障碍。业界现在必须采取措施解决这个问题。

DeFi之道

个人专栏

阅读更多

金色财经 善欧巴

金色早8点

白话区块链

Arcane Labs

Odaily星球日报

MarsBit

欧科云链

深潮TechFlow

BTCStudy

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

区块博客

[0:15ms0-6:609ms