1.前言
相对于ethereum的soldity语言,move语言最近越来越火,而且由于其自身相对于soldity的强大优势,越来越受到重视。其中move语言被用于很多明星项目,比如Aptos,sui。近期我们的Web3安全漏洞检测产品发现了一个整数溢出的漏洞。可以导致Aptos节点崩溃,造成拒绝服务。本文通过对该漏洞的介绍,希望大家对move语言以及其安全性有更多的认识和理解。作为move语言安全性研究的领导者,我们会持续关注move语言的安全性,为move的生态安全做出我们的贡献。?
2.Move语言的重要概念
模块和脚本?
Move有两种不同类型的程序:模块和脚本。模块是定义结构类型以及对这些类型进行操作的函数的库。结构类型定义了Move的全局存储的模式,模块函数定义了更新存储的规则。模块本身也存储在全局存储中。脚本是可执行文件的入口点,类似于传统语言中的主函数main。脚本通常调用已发布模块的函数来更新全局存储。脚本是临时代码片段,不会发布在全局存储中。一个Move源文件可能包含多个模块和脚本。然而,发布模块或执行脚本都是独立的虚拟机操作。?
对于熟悉操作系统的人来说,move的module就类似系统的可执行文件运行的时候加载的动态库模块,而script类似主程序。用户可以通过自己编写script,来访问全局存储,包括调用module模块的代码。?
全局存储?
Move程序的目的是读取和写入树形的持久全局存储。程序不能访问文件系统、网络或任何此树以外的数据。?
在伪代码中,全局存储看起来像:?
《金融时报》:新加坡星展银行计划扩大加密货币业务:9月6日消息,据英国《金融时报》报道,新加坡最大商业银行星展银行仍计划发展其加密货币和数字资产业务,并表示希望扩大其数字交易所并为其在亚洲的 30 多万名高净值客户提供服务。
金色财经此前消息,星展银行经纪部门在去年获得由新加坡金融管理局颁发的加密货币许可证,允许其机构和高净值客户通过邀请访问星展数字交易所。星展银行首席执行官Piyush Gupta表示,该银行在数字交易所目前拥有不到1000名会员,不过很快将通过其星展银行移动银行应用向亚洲 30 多万名高净值客户提供服务,包括私人银行、合格投资者、其他交易所和基金。[2022/9/6 13:10:39]
从结构上讲,全局存储是一个森林,这个森林由以账户地址为根的树组成。每个地址可以存储资源数据和模块代码。如上面的伪代码所示,每个地址最多可以存储一个给定类型的资源值,最多可以存储一个给定名称的模块。??
MOVE虚拟机原理?
movevm与evm虚拟机都一样,需要将源码编译成字节码,然后在虚拟机中执行,下图是整体的流程:?
1.将字节码通过函数execute_script被加载进来?
2.执行load_script函数,这个函数主要用来反序列化字节码,并校验字节码是否合法,如果校验失败,就会返回失败?
新加坡加密交易所Coinhako获SBI、Sygnum、Azimut投资:12月7日消息, 根据今天发布的一份声明,总部位于新加坡的加密货币交易平台Coinhako获得了SBI-Sygnum-Azimut Digital Asset Opportunity基金的支持,这轮融资获得了3倍超额认购。该基金是一个风险投资基金,由日本SBI集团、瑞士数字资产银行Sygnum Bank和意大利Azimut(欧洲主要独立资产管理公司)共同管理。此次投资的具体金额未予披露。Coinhako的声明称,该公司将利用新资金向东南亚地区以及机构和高净值客户细分市场扩张。[2021/12/7 12:56:53]
3.校验成功之后就会开始执行真正的字节码代码?
4.执行字节码,访问或修改全局存储的状态,包括资源,modules?
注:move语言还有很多特性,这里我们就不一一介绍,后续我们会从安全性角度继续分析move语言的特性。?
3.漏洞描述
本漏洞主要设计验证模块,在讲具体漏洞之前先介绍下验证模块的功能以及StackUsageVerifier::verify。?
验证模块?
通过前面,我们知道在真正执行字节码代码之前,会有验证字节码的环节,而验证环节有可以细分为好多子过程,?
分别是:?
BoundsChecker,边界检查,主要是用来检查module与script的边界安全。具体包括检查signature,constants等的边界?
DuplicationChecker,该模块实现了一个检查器,用于验证CompiledModule中的每个向量是否包含不同的值?
新加坡WBF交易所将上线DCIP:据官方消息显示,WBF交易所即将上线DCIP。
据悉,DCIP存在的意义就是成为一个公平公正的第三方桥梁,架通需求,为各类金融企业及单位,创造流通性更高,效率更超前的技术支撑性平台。
与此同时,DCIP在资产信托、信贷产业中也将发挥巨大推动作用,不断深化技术在产品中的深度应用,让社会金融生活实现从日常财务需求到投资理财、大宗交易等等金融流程统一协调、透明安全,打造适配度更高的技术平台。[2021/4/15 20:23:12]
SignatureChecker,用于检查signature被用于函数参数,本地变量,结构体成员时,字段结构正确?
InstructionConsistency,验证指令一致性?
constants用于验证常量,常量的类型必须是原始类型,常量的数据正确的序列化为其类型?
CodeUnitVerifier,验证函数体代码的正确性,分别通过stack_usage_verifier.rs与abstract_interpreter.rs来达到目的?
script_signature,用于验证一个脚本或入口函数是否是一个有效的签名?
该漏洞发生在verify环节CodeUnitVerifier::verify_script(config,script)?;函数中。可以看这里有许多的verify子流程。?
报告:新加坡是区块链研究和商业化的关键中心:根据今日发布的《2020年新加坡区块链生态系统报告》,由于学术机构和私营部门的贡献,新加坡的区块链研究出版物数量在东盟位居首位,全球排名第三。该报告由OpenNodes、淡马锡、IBM、普华永道新加坡公司、安永和SGTech共同提交,并得到了Infocomm媒体发展局和新加坡金融管理局的支持。
就其规模而言,新加坡每百万常住人口生产了近28种与区块链相关的出版物,是世界上创作量最高的国家之一。此外,报告还发现,新加坡此类研究的质量也值得注意。在所有区块链相关出版物中,新加坡在全球排名第六位,这些出版物被Web of Science认定为其领域内的高度引用。新加坡区块链出版物的平均引用量也是全球最高的国家之一,大大领先于美国等其他国家。
为了评估新加坡区块链相关活动的发展,普华永道新加坡公司为该报告进行了调查。结果显示,区块链成为新加坡2021年的三大技术趋势之一,70%的受访者表示支持这项技术。调查还将新加坡列为亚太地区区块链技术领先国家之一。新加坡对区块链发展持乐观态度,近一半的受访者认为区块链技术的增长将随着更多的应用和机会而加速。(Business Times)[2020/12/7 14:27:22]
分别是stack安全校验,类型安全校验名,本地变量安全性校验,以及引用安全校验。而漏洞产生的地方就在栈安全校验过程中。?
栈安全校验(StackUsageVerifier::verify)?
TechCrunch创始人Michael Arrington布局区块链,以顾问身份加入新加坡团队CNN Token:据悉,美国著名科技类博客TechCrunch创始人Michael Arrington近日加入CNN Platform项目并担任顾问,指导该项目的区块链技术应用以及内容运营。Michael Arrington是TechCrunch的创始人,曾被《时代》杂志誉为全球最具影响力的人物之一。CNN Platform是由新加坡D-Run Foundation基金孵化的区块链项目,旨在打造最大最具影响力的内容生态社区。此前,印度排名第一的新闻应用NewsDog也与CNN Platform达成战略合作,并成为该项目上的第一个实际应用。[2018/2/26]
该模块用于验证函数的字节码指令序列中的基本块是否以平衡的方式使用。每个基本块除了那些以Ret操作码结尾的,必须确保离开block时候栈高度与开头时候相同。此外,对于任何基本块的块,栈高度不得低于开始时的栈高度。?
循环校验所有代码块是否满足以上条件:??
即循环遍历验证所有基本块的合法性。?
漏洞详情?
前面已经介绍过,由于movevm是栈虚拟机,在验证指令合法性的时候,很显然,第一需要确保指令字节码是否正确,第二需要确保栈空间经过一个block代码块调用之后,栈内存合法,即栈操作之后,栈保持平衡。verify_block函数正是用来完成第二个目的的。?
从verify_block代码中我们可以看到,for循环会循环解析block代码块中的所有指令,然后通过对num_pops,num_pushes加减操作来验证指令块的对栈的影响是否合法,首先通过对stack_size_increment<num_pops来判断栈空间是否合法,如果num_pops大于stack_size_increment就说明字节码pop的数目大于栈本身的大小,就返回错误,字节码校验失败。然后通过stack_size_increment-=num_pops;stack_size_increment+=num_pushes;这两条指令来修改每个指令执行之后对栈的高度的影响,最后当循环结束之后,stack_size_increment需要等于0,即保持本block内的操作之后,需要保持栈的平衡。?
看起来这里似乎没什么问题,但是由于这里在执行16行代码的时候,没有去判断是否存在整数溢出,导致可以通过构造超大num_pushes,间接控制stack_size_increment,从而产生整数溢出漏洞。那么如何构造构造这样一个巨大的push数目呢?这里首先需要介绍一下movebytecode文件格式。?
movebytecode文件格式?
如同WindowsPE文件,或者linuxELF文件,move的字节码文件以.mv为结尾,文件本身也是有一定的格式的,总的来说movebytecode文件格式如图所示:?
首先是macgic,值为A11CEB0B,接下来是版本信息,以及table的数目,之后是tablesheaders,这里可以有很多个tables,tablekinds就是table的类型,总共有0x10种,更多详细信息可以去看move语言文档,接下来是table的偏移,以及table的长度。之后就是table的contents了,最后是SpecificData,有两种,对于module来说就是ModuleSpecificData,对于script类型来说就是ScriptSpecificData。?
构造的恶意文件格式?
这里我们与aptos交互的时候,是以script来完成的,所以我们构造了下图所示的文件格式,就可以造成stack_size_increment溢出:?
首先来解释一下这个字节码文件的格式:?
+0x00-0x03:是macgicword0xA11CEB0B?
+0x04-0x7:文件格式版本,这里为版本4?
+0x8-0x8:为tablecount这里为1?
+0x9-0x9:为tablekind这里是SIGNATURES类型?
+0xa-0xa:为tableoffset,这里为0?
+0xb-0xb:为tablelength,这里为0x10?
+0xc-0x18:为SIGNATURESToken数据?
从0x22开始为scrip的mian函数code代码部分?
通过move-disassembler工具,我们可以看到指令的反汇编代码如下:?
其中0,1,2三条指令对应的代码就是红框,绿框,黄框的数据。?
LdU64与漏洞本身无关,我们这里就不做过多解释,感兴趣的可以自行查看代码。这里重点解释下VecUnpack指令,VecUnpack的作用就是在代码中碰到vector对象的时候,需要将数据全部push到栈上。?
在构造的这个文件中,我们构造了两次VecUnpack,其vector的num分别是3315214543476364830,18394158839224997406,?
当执行函数instruction_effect的时候,实际上执行的是下面第二行代码:?
执行完instruction_effect函数第一次返回(1,3315214543476364830),此时stack_size_increment为0,num_pops为1,num_pushes为3315214543476364830,执行第二次返回(1,18394158839224997406)。当再次执行stack_size_increment+=num_pushes;?
stack_size_increment已经为0x2e020210021e161d(3315214543476364829),?
num_pushes为0xff452e02021e161e(18394158839224997406),当两者相加之后,大于u64的最大值,产生了数据截断,stack_size_increment的值成为了0x12d473012043c2c3b,造成了整数溢出,从而造成了aptos节点崩溃,进而导致节点运行停止的严重影响(由于rust语言的安全特性,并不会向c/c++那样造成更进一步的代码安全影响)。?
4.漏洞影响
本漏洞由于是发生在movevm执行模块,所以对于链上节点,只要执行该字节码代码,就会造成DoS攻击,严重的情况下,可以使得aptos网络完全停止运行,会对其生态造成难以估量的影响,以及对节点的稳定性产生严重影响。?
5.官方修复
当我们发现这个漏洞之后,第一时间报告给了官方,官方也很快修复了漏洞:?
官方的修复也很简单,就是对stack_size_increment的加减分别做了溢出检测。如果有溢出就直接返回异常。?
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。