11月9日上午,在由巴比特主办的“2019世界区块链大会·乌镇”分论坛——“区块链大事件:新热点与探索者”现场,巴比特CTO禁猎发表《融合算力,释放价值》主题演讲。
最近几十年,全社会的算力呈现爆发式的增长,给人类的生活、科学技术各个方面带来了很多颠覆性的改变。然而,目前区块链行业里面的算力就如同堰塞湖,算力并未与其他行业打通,价值得不到释放。针对这一痛点,巴比特推出矩池云平台,以算力为桥梁,采用智能调度算法、分布式存储和混合云部署等创新技术,为Web用户和企业用户提供算力服务,进而打通区块链世界与其他产业的隔阂,加速推进产业区块链落地。
以下为金磊演讲全文,巴比特整理:
今天非常高兴有这个机会来这里跟大家做一个分享,我是巴比特CTO金磊。
之前我一直在互联网行业做技术开发,去年加入巴比特以后才开始接触区块链行业。在这一年当中,我能感受到区块链行业的迅猛发展。
我想从不同的角度聊一聊区块链怎么去跟具体行业实现落地应用。
我想以这两张图片来引出接下来的话题。看左边这张图片,在座的朋友可能第一个反应是:这是一个水力发电站,有廉价的电力,会想到挖矿,然后接下来又想到收益。但是我今天不想狭隘地聊挖矿这件事情,因为挖矿无非牵涉到硬件、算力、收益等,我想从一个更广的视角去聊一聊算力这件事情。
大家都说2020年是区块链落地的元年,在这个大背景下,算力怎么推动这个行业的落地?怎么给社会带来更大的价值?这是我们现在要去回答的一个问题。
让我们回到这两张图片。左边这张是水库大坝,右边那张图片可能很多朋友不一定知道是什么,其实它是一个堰塞湖。水库和堰塞湖之间有什么区别?水库是人工围成的湖泊,它可以通过人工的调节,在枯水期的时候可以开闸放水,去缓解下游的旱情,在丰水期把水库关上蓄水,同时避免下游的洪涝灾害。所以通过水库的调节作用,对下游的生产生活有很大的正面促进作用。
但是堰塞湖是土石塌方形成的湖泊,不受人的意志而控制。随着水位的上升或者土石的松动随时都有塌方的可能,有下游的生产生活造成很大的威胁。
在我看来,在今天区块链行业里面的算力其实更像是一个堰塞湖,这些算力是被围在堰塞湖里面,有很高的水位,同时这些算力跟其他行业之间有很少的流通,也被外界诟病POW挖矿消耗大量的算力,但是在今天挖矿这件事情的收益也是非常低的。
亚当史密斯有一个非常著名的自由贸易理论,就是说参加自由贸易的双方其实都可以从贸易当中获得收益。同样的理论也可以应用到区块链和其他行业之间的算力流通,如果我们能把算力打通的话,其实也能够给整个系统产生更大的价值。
说到算力,肯定就离不开摩尔定律,摩尔定律是说每隔18个月到24个月,我们在集成电路里面的晶体管数目都会翻1倍。早在1971年的时候,英特尔发布的4004芯片里面只有区区2300个晶体管,芯片的制造工艺是10微米,相当于现在头发丝的粗度。到今天,大家手里的智能手机里面的芯片已经包含了100-200亿个晶体管,制造工艺也是缩小到了9纳米甚至是7纳米。芯片里的晶体管的数目可以看作是算力的近似指标,我们可以看到在最近几十年里面,其实整个算力是一个爆发式的增长。同时,由于算力的爆发式增长,也是给我们的生活包括社会、科学技术各个方面都带来了很多颠覆性的改变。
我们身边的很多例子,比如说智能手机甚至是4G、5G的应用,给我们生活带来了很大便利。下面我讲一下大家可能并不是那么熟悉,但是给人类社会带来非常深远影响的几个例子。
案例1:基因测序。在人的DNA里面有4种碱基,而基因测序做的事情就是测定DNA里面这4种碱基的排列顺序。通过对个体的基因测序,我们可以发现病变的基因,从而对疾病进行提早的治疗和预防。人类第一次完整地完成基因测序是在2003年,前前后后当时一共花了13年的时候,耗费了10亿美金。而今天,有些朋友可能已经看到一些基因测序的产品商业化了,而我们今天去做一个基因测序只需要不到2天的时间,同时费用也在一千美金以内。这是近20年以来算力的爆发式增长,包括存储变得越来越廉价,才使新的算法得以应用,大大提高了计算的效率。
案例2:药物研制。在屏幕上显示的3位科学家获得了2013年诺贝尔化学奖,给他们颁诺贝尔奖的原因是他们在70年代的时候提出了分子计算模型。什么是分子计算模型?就是利用这个模型,我们可以通过计算机计算的方法去模拟化学反应的过程。本来复杂的化学反应是非常耗时的,我们在药物研制当中要做千百次的实验,可以想象这当中的时间成本。通过分子计算模型,我们可以非常简单地在计算机里面模拟整个过程,然后预测里面化学反应的结果。可以想像如果我们投入大量的算力,其实我们可以快速地完成之前非常耗时的很多实验来得到结果。但是在80年代、90年代分子计算模型并没有在药物研制当中被大规模采用,为什么?因为当时的算力实在太昂贵了。
举个例子:在1985年,当时世界上最快的超级计算机是克雷2号,这台机器要卖1600万美金,算上通货膨胀,折算到现在的价格可能要上亿美金了。但是到今天,一台过时的iPhone4的处理器计算能力已经是克雷2号的2倍,我们只要花区区几百美金就可以买到一台iPhone。正是算力的爆发式增长,同时伴随着大数据的兴起,才使得分子计算模型在药物研制当中得以应用,大大缩减了研发的成本。大家可以想像随着新药物的推出,使得原来的绝症变得可控,给人类社会带来了巨大的福音。
案例3:人工智能。这是最近几年非常火爆的话题。我们先来简单回顾一下整个人工智能的发展史。在17世纪、18世纪,贝叶斯理论被提出来,贝叶斯理论是现在机器学习和人工智能的理论根基。但是在60年代之前,其实人工智能的发展几乎都是基于统计学的原理做的,我们会设定一个方程,通过过去的数据产生拟合方程,用拟合方程结果预测以后发生事件的可能性。60年代到90年代之间,整个人工智能的发展几乎是停滞的,没有太大的创新,没有太大的激动人心的成果。一直到90年代、2000年的时候,科学家们才开始转向用数据驱动的方法去做机器学习的训练,也就是我们现在所说的深度学习。同时伴随着GPU的出现,提供了廉价的算力,使得大规模的并行计算变得可能,才推动了机器学习或者深度学习的迅猛发展。
通过这三个例子,我们可以真实地看到算力的增长给人类社会、给科学技术带来了非常巨大的变革。
虽然过去几十年我们看到了算力的巨大增长,但是我们人类对算力的需求可以说没有止境,或者说我们现在所拥有的算力其实还是非常渺小。为什么这么说?我们还是用几个数据来说话。
大家比较熟悉的1880态的显卡,它的算力是11TeraFlops,Flops代表每秒钟浮点计算的显卡。一张1080态显卡计算里是10的12次方。有人估算过全球算力的综合,它在10的21次方,折算下来全球算力综合大概是11张1080态。科学家也对我们人的大脑做了估计,这是一个估计的值,它是在1万个YottaFlops,像多于10个28次方,什么概念?人的大脑的算力是全世界算力加起来总和的1000亿倍。今天做机器学习或者人工智能的研究的终极目标,其实是想达到AGI。今天大家所看到的机器学习或者深度学习出来的人工智能,可以说是一个伪的人工智能,因为它们只能解决一个特定范围、非常特定场景下的小问题,然而通用人工智能其实是想要让机器去像人一样思考,能够在各个复杂的环境下解决不同的问题。大家可以从这几个数字看出,如果我们要实现AGI,我们的算力至少要有成千上亿倍的增长才行。
随着制造工艺的不断优化、计算架构的不断迭代,我相信在不远的将来,我们的算力还是会以指数级别的增长。另一方面,我们的存量算力也有非常大的优化空间。据估计,目前全世界高端显卡的保有量在千万张级别,每年有几百万张的显卡被矿工买去挖矿。再加上ASIC芯片,其实区块链在推动算力的增长包括芯片的研发上起到非常大的作用。
这几天的会议里面,大家可能听到一个非常多的词汇是“产业区块链”,什么叫“产业区块链”?产业区块链就是要让区块链跟具体的行业结合,但是一个现实是其他行业的朋友可能对区块链的了解并不多,有时候甚至是带有偏见的。我就在想我们是否可以打算力打通,让区块链推动算力的发展、推动其他行业的发展,从侧面跟其他行业融合,让他们了解区块链,推动区块链的落地应用。
巴比特抱着这个愿景投入了很多研发力量做矩池云的产品。我们的目标是想打通算力流通的障碍,带来更多的社会价值。大家可以在matpool.com看这个产品。我在这里举两个数字,让大家有更直观的感觉:今天如果你有一张1080态显卡拿去挖矿,你一天收益大概在5.6元。但是作为一个科学家或者工程师,你想去做模型的训练,你去主流的云计算提供商那边租GPU的服务器,你要支付的费用是10-20元/时,一边是5.6元/天的收益,另外一边是10-20元/时的费用,大家简单算一下这里面的收益和费用支出之间有10-20倍的差距。如果我们能把算力流通起来,应该是大家乐见其成的一件事情。
为了实现这个目标,我们做了很多努力,我们做了很多技术上的创新,我们研发了自己的智能调度算法。因为有别于传统的云计算提供商,其实他们的服务器都部署在IDC里面,有非常好的非常稳定的网络环境、非常低的延时。但是我们这边的算力是通过公网连接进来,很多时候网络环境不可控。很多时候,其实这些机器通过内网、通过路由器接入到我们这个平台,这些机器是没有自己的独立IP。没有独立的公网IP,外部用户无法直接访问它们,我们也研发了自己独有的网络穿透技术,让我们的用户得以有非常低的延时访问这些硬件。之前举的几个例子,大家能感受到算力和存储不分家,我们业绩预开源的技术,研发自己特有的具有高速缓存的分布式存储。
还有一个很大的问题,在矿业当中很大一部分的算力都是来自于AMD的显卡。但是问题是目前世界上所有主流的深度学习的计算框架都是基于英伟达的CUDA框架去开发的。为了解决这个问题,我们也尝试让tensorflow深度学习框架在OpenCL框架上跑起来。除了刚才提到的公有云平台,我们的整个技术架构也支持私有和混合云的部署,适应各种各样的需求。
我们的算力租赁有两种形式:一种是C端用户,大家可以通过Web的形式进行算力的租赁,是以机器的形式,用户可以通过SSH等形式访问这些算力。针对我们的企业用户,我们也提供了PaaS层面的API,包括PythonSDK,用户可以把计算任务通过API的形式提交到我们的节点,与我们的节点做统一的调度。
最后分享一些数据,矩池云平台在今年10月份上线,现在还不到一个月时间,已经有1000个注册用户。他们在我们的平台上跑了将近1万个卡时,PaaS任务提交1万多个。
最后我想说打通算力,在各个行业之间的流通,这个目标其实很大,里面有很多难的问题,在这个过程当中我们需要脚踏实地一步步做。在这个过程当中,也希望在座各位有志同道合的朋友可以一起加入尽量。不管你手里面有算力还是希望租赁到算力来进行计算,都可以跟我们一起来合作,来共同推进区块链的落地应用,推进这个行业的发展。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。