南澳大学的放射科医师、医学专家,在阿德莱德大学与公共卫生学院攻读医学博士学位的LukeOakden-Rayner从今年5月开始就在追逐医疗AI领域的发展,他写了一系列的博客来介绍这一领域的最新进展,目前更新到第三篇,其系列博客的名字就叫《人类医学的终结-医学AI研究最前沿》。
他这一系列博客的文章将主要讨论:机器会不会在短时间内取代人类医生。
他说,这些文章将会深入到医疗自动化的最前沿研究中。此前许多关于医疗AI的文章中,我们简单地假设深度学习可以将医疗的任务自动化,这么做是有意义的,因为这样我们就能获得一大堆的概念和定义,但是,在这篇文章中,我们首先要对这一说法进行一下论证。
接下来,会讨论医疗AI所面临的阻碍,此前许多讨论都集中在外部的障碍,比如监管和自动化的普及率。但是我们甚至都没有触碰到最本质的问题——技术上的挑战,它可能会减缓AI对医生的替代。
在前面的三篇文章中,他列举了他认为深度学习在AI领域的两大里程碑式的研究,分别标志着这一领域所取得的第一和第二个大突破:谷歌发表在美国医学会杂志关于糖尿病视网膜病变的研究和斯坦福大学的研究者在2017年发表在Nature杂志上的研究“达到皮肤病学家水平对皮肤癌的分类”。
此外,他还介绍了一些“小的但是不容忽视的”研究,比如“高分辨率乳腺癌筛查与多视角深卷积神经网络”和“检测巨细胞病变图像上的癌症转移”。
通过这些最前沿的研究,他总结出了医疗AI领域的6大特征:
医学影像提出了大多数其他图像分析AI不必面对的特定问题。其中之一就是“瓦力在哪里”的问题:图像通常是海量的,但疾病的特征通常是小而微妙的。
在医疗任务中,通过丢弃像素来压缩图像可能会损害性能,这意味着预训练不适用。
巨大的图像带来了技术上的挑战,因为深度学习的硬件很难匹配其需求。
解决这些挑战的一个方法是通过基于补丁的训练,但是这会成倍地增加数据集收集的时间和成本。
临床人群的低发病率意味着我们通常需要庞大的数据集才能找到足够的阳性病例。就算这些数据集本身已经存在,这也会大大增加成本。
医学AI系统在某些特定方面比人类专家更灵活,即使水平达不到人类的层次,但也可能是有用的。
以下是LukeOakden-Rayner的博客文章内容,以第一人称方式呈现:
医学深度学习的第一个大突破
第一部分,我们将会对一个研究进行深度的解读,这绝对是一项最先进的研究。
首先,我想提醒大家,从2012年开始,深度学习才成为一种可应用的方法被使用,所以,我们在医学中使用这一技术的时间还不超过5年,并且,要知道,医疗人员在技术上的反应通常会慢半拍。有了这些前提,我们会发现现在取得的很多结果都是令人难以置信的,但是,我们也必须承认,这仅仅是开始。
接下来,我会对一些明显代表作医疗领域自动化取得突破的论文进行解读,同时会补充一些有用的对话。除了介绍论文,还会讨论以下几个关键要素:
任务:这是一个临床的任务吗?如果这一工作被自动化,有多少医疗从业者会被颠覆?为什么这一任务会被选中。
数据:数据是如何收集和处理的?它如何遵守医学审查和监管要求?我们可以更广泛地了解医疗AI的数据需求。
结果:它们与人类医生相比能力如何?它们究竟测试了什么?我们还能收集更多的什么?
结论:这一研究的重要性在哪?可扩展的地方在哪?
第一个论文。谷歌发表在美国医学会杂志关于糖尿病视网膜病变的论文。
任务:糖尿病性视网膜病变是致盲的主要成因之一,主要由眼睛后部细小血管损伤引起。这是通过观察眼睛的背面,可以看到血管。所以这是一个感知任务。他们训练了一个深度学习系统,执行与糖尿病视网膜病变评估相关的几项工作。文章标题中所提到的结果是评估“可参考”的糖尿病性视网膜病变,其正在检测中度或更差的眼睛疾病。他们还评估了识别严重视网膜病变并检测黄斑水肿的能力。
数据:他们对13万个视网膜照片进行了训练,每个级别由3到7名眼科医生进行评估,最终的标签以多数票决定。图像来自使用各种相机的4个位置的康复临床数据集。
网络模型:他们使用了GoogleInception-v3深层神经网络的预训练版本,这是目前使用最好的图像分析系统之一。预训练通常意味着他们已经接受过训练的网络来检测非医疗物体,然后进一步对特定医学图像进行了训练。这就是为什么网络只能接受229x299像素的图像。
结果:这篇论文我认为是医学深度学习的第一个大突破。他们的AI系统获得了与单个眼科医生相同水平的表现,在于眼科医生的平均水平相比时,也不落下风。
图:彩色的点是人类眼科医生,黑线是谷歌的深度学习系统。
与人类以上相比,他们的系统在检测黄斑水肿上做到了相同的水平,但是在更严重视网膜病变绝对值上要差一些。
关于这一研究的10点总结
Google训练了一个系统,以检测糖尿病视网膜病变,系统的表现与一组眼科医生的表现相当。
这是一个有用的临床任务,这可能不会节省大量资金,也不会在自动化的时候取代医生,但具有很强的人道主义动机。
他们使用130,000个视网膜图像进行训练,比公开的数据集大1到2个数量级。
他们用更多阳性的案例丰富了他们的训练集,大概是为了抵消训练对不平衡数据的影响。
由于大多数深度学习模型都针对小型照片进行了优化,所以图像被大量采样,丢弃了90%以上的像素。目前看来,我们还不知道这是不是件好事。
他们使用一组眼科医生来标注数据,很可能花费了数百万美元。这是为了获得比任何单个医生的解释更准确的“真正的真相”。
第5点和第6点是所有当前医学深度学习系统的错误来源,而且人们对这些话题知之甚少。
深度学习系统比医生有优势,因为它们可以用于各种“操作点”。相同的系统可以执行高灵敏度筛选和高特异性诊断,而无需再训练。所涉及的trade-off是透明的。
这是一个很好的研究。它在可读性上是令人难以置信的,并在文本和补充中包含了大量有用的信息。
该研究似乎符合目前FDA对510法案的要求。虽然这项技术不太可能要通过这一手续,但是该系统或衍生物完全可能在未来一两年内成为临床实践的一部分。
第二篇具有代表性的突破性研究是斯坦福大学的研究者在2017年发表在Nature杂志上的研究“达到皮肤病学家水平对皮肤癌的分类”。
任务:皮肤科是主要专注于皮肤病变的医学专业。他们处理皮肤癌和其他全身性疾病的肿瘤,皮疹和皮肤表现等系统疾病。作者训练了深度学习系统,用于执行与皮肤科实践相关的几项工作。标题的结果是对“需要活检”病变的评估,这是鉴定可能患有皮肤癌并需要进一步处理的患者。他们还评估了直接从图像中识别癌症的能力,以及一项更复杂的任务,试图诊断病变亚组。
数据:他们从18个不同的公共数据库以及斯坦福医院的私人数据中训练了13万个皮肤损伤照片。不幸的是,这篇文章并没有说清楚数据来源及如何构建,所以我真的不知道训练标签是什么。在论文中,他们将数据描述为“皮肤科医生标注的”,但也提到了各种位置的活检结果。我想我们可以假设,这个数据的大部分是被单个皮肤科医生标记,没有活检结果。
网络模型:同第一个研究。
结果:本研究是我认为医学深度学习的第二个重大突破。他们比大多数单个皮肤科医生以及他们提供的比较的皮肤科医生“平均”水平获得了更好的表现。
关于这一研究的8点总结
1.斯坦福大学训练了一个系统来鉴别需要活检的皮肤病变。皮肤癌是浅色皮肤人群中最常见的恶性肿瘤。
2.这是一个有用的临床任务,是目前皮肤科实践的很大一部分。
3.他们使用13万个皮肤病变照片进行训练,并且用临床上典型的阳性病例丰富了他们的训练和测试组。
4.图像被大量采样,丢弃了大约90%的像素。
5.他们使用“树实体论”组织训练数据,通过培训来提高其准确性,以识别757类疾病。这甚至在更高级别的任务上改进了结果,如“这种病变需要活检吗?
6.他们比单个皮肤科医生能更好地识别需要活检的病变,具有更多的真阳性和较少的假阳性。
7.虽然可能存在监管问题,但该团队似乎已经有一个有用的智能手机应用程序。我希望在未来一两年内可以为消费者提供这样的东西。
8.对皮肤病的影响尚不清楚。至少在短期内,我们实际上可以看到皮肤科医生的需求不断增加。
最后,LukeOakden-Rayner总结说,我认为这些研究是突破性的,事实也说明了这个问题,两个研究组似乎都在研究初次发表后六个月内临床测试了这些系统。谷歌的视网膜病变研究实际上已经完成了初步的临床试验,并正在印度推出系统,旨在解决受过训练的眼科医生处理糖尿病眼病短缺的问题。斯坦福大学皮肤科组正在建立一个智能手机应用程序来检测皮肤癌。
医疗是最容易受到AI影响的行业,独立的AI诊断中心前景可期
普华永道刚刚发布了名为“探索AI革命”的全球AI报告,特别推出了“AI影响指数”,对最容易受到AI影响的行业进行了排名。其中,医疗和汽车并列第一位。
AI影响评分从1-5,医疗和汽车都是3.7分,并列第一:
而实际上,从2011年开始,医疗领域一直高居AI行业应用前列。CBInsights曾发布过AI应用的“行业热图”,可以直观地看出智能医疗的火热程度。
从全球范围来看,IDC在其《全球半年度认知/人工智能支出指南》中将医疗人工智能统列为2016年吸引最多投资的领域之一,并表示在未来五年内,包括医疗人工智能+诊断和治疗系统的使用案例将获得最大的发展。在五年期间,它预测医疗健康人工智能投资的年复合增长率为69.3%。
国内,根据亿欧智库的相关研究数据,截止至2017年8月15日,国内医疗人工智能公司累积融资额已超过180亿人民币,融资公司共104家。
说回到普华永道的最新报告。该报告以“基于数据的诊断支持”作为智能医疗的高潜力用例,认为“人工智能最初可能被作为人类医生的辅助来采纳,而不是替代人类医生。这将改善医生的诊断,但此过程也为AI学习提供了有价值的见解,让其可以不断学习和改进。人类医生和AI驱动的诊断之间的这种持续的相互作用将提高系统的准确性,并且随着时间的推移,人类将有足够的信心完全授权AI系统进行自主操作。”
实际上,这一美好前景已展现出了些许萌芽。如依靠计算机视觉的智能医疗影像识别,已经随着深度学习等技术的使用,来到了“超越人类水平”的临界点。同时,2017年8月,国家卫计委在新闻发布会上也传达出一个重要信息:将在已有的5类可独立设置的医疗机构上,再增加5类独立设置的医疗机构类别。随着支持社会办医的政策落实,医疗的“牌照”价值正在下降,未来很有可能出现独立的AI诊断中心,直接为患者提供诊断服务。
智能医疗是否达到超越人类水平的临界点?看大咖怎么说
将于2017年11月8日在北京国家会议中心举办的AIWORLD2017世界人工智能大会特设智能医疗论坛,并邀请到来自谷歌、卡内基梅隆大学、康奈尔大学等多位相关领域的专家和创业者,就“医疗AI在哪些方面已经或即将超越人类医生”、“独立的AI医疗系统何时能够出现”等问题进行展望、分享。智能医疗的真实发展现状如何?技术瓶颈何在?未来最有潜力的应用是哪些?请来世界人工智能大会智能医疗论坛寻求答案。
我们隆重为您介绍首批确认的智能医疗论坛演讲嘉宾,他们是:谷歌资深科学家韩玫;美国卡内基梅隆大学计算机学院计算生物学副教授马坚;大数医达创始人、卡内基梅隆大学计算机学院暨机器人研究所博士邓侃;康奈尔大学威尔医学院助理教授王飞。
马坚
美国卡内基梅隆大学计算机学院计算生物学副教授
马坚,2016年1月起担任卡内基梅隆大学计算机科学学院计算生物学副教授,他也是CMU机器学习系的教授。他曾就职于伊利诺伊大学香槟分校,副教授)。他的小组研究一直专注于算法开发,以帮助更好了解人类基因组的基本功能和人类疾病如癌症的分子机制。
演讲主题:精准基因组数据与智能医疗最新进展
演讲概要:互联网下半场,人工智能正在加速数据系统的闭合。医疗和健康数据是其中最重要也是最难获得和解析的一环。从可穿戴设备到IoT,到医学图像、医疗档案和个人基因组信息,如何加速多模态高维数据的整合,推动产业发展,同时又促进个性化普惠医疗,提升民众的健康管理,需要学界和业界的创新性合作。我从基因组数据的最新发展入手,介绍一下精准基因组和智能医疗的进展,并探讨与整个互联网产业创新性结合的可能性。
邓侃
大数医达创始人,美国卡内基梅隆大学计算机学院暨机器人研究所博士
邓侃,上海交通大学本科及硕士,美国卡内基梅隆大学计算机学院暨机器人研究所博士,专攻人工智能及数据挖掘。历任美国甲骨文公司主任系统架构师,美国泰为手机导航公司北京分公司总经理,百度高级总监并主管网页搜索和知识图谱。
2015年,邓侃创建北京大数医达科技有限公司,旨在将深度强化学习技术应用于医疗健康领域。大数医达对几亿份三甲医院病历,进行结构化解析,构建海量训练数据,并结合临床指南,训练医疗深度强化学习模型。用于实现面向患者的医疗咨询服务,面向基层医生的临床导航服务,以及面向医院和医疗保险的全流程精细化质量控制和成本控制服务。
演讲主题:多模态智能疾病诊断系统的四大技术难点
演讲概要:北京大数医达科技有限公司实现了多模态智能疾病诊断系统,该系统把CNN、RNN、Attention、GAN、RL、MCTR、KnowledgeGraph等多种前沿技术融为一体,构建医学智能诊断新体系。本演讲重点介绍该系统以下4个方面的技术难点。
1.把多模态数据,都转换成以医疗知识图谱为轴心的语义向量,在同一个参照系下进行相互比较和交叉操作;
2.在知识图谱为轴心的语义向量空间中,融合多模态数据,并使用生成对抗模型提供可行又可靠的质量评估方案;
3.用卷积神经网络技术,从病情描述中提炼病情特征,用聚焦机制,从医学知识图谱中补充相应病理逻辑,优化疾病的诊断与验证;
4.用深度强化学习和蒙特卡洛搜索树技术,给医生推荐最佳后续化验和检查项目,补充病情描述,用最小的代价,找到诊断金指标,提高诊断精度。
王飞
康奈尔大学威尔医学院助理教授,IBM沃森研究中心顾问
王飞,博士,康奈尔大学威尔医学院助理教授,IBM沃森研究中心顾问,法国液空集团研究顾问。曾任职于康涅狄格大学以及IBM沃森研究中心。他于2008年在清华大学自动化系获得博士学位,其博士学位论文“图上的半监督学习算法研究”获得了2011年全国优秀博士论文奖。主要研究方向包括数据挖掘,机器学习技术在医疗信息学中的应用。王飞博士已经在相关方向的顶级国际会议和杂志上发表了近190篇学术论文,引用超过5000次,H指数39。其论文论文曾ICDM2016最佳论文提名,ICDM2015最佳学生论文,ICHI2016最佳论文奖,ICDM2010的最佳研究论文提名奖,SDM2015与2011最佳研究论文候选以及AMIA2014转化生物信息学峰会的MarcoRomani最佳论文候选。王博士还是MichaelFox基金会主办的帕金森病亚型发现数据竞赛的冠军获得者。王飞博士是2017年国际医学信息学大会的分领域主席,2015国际健康信息学大会的程序委员会主席。王博士同时还是AMIA知识发现与数据挖掘(KDDM)工作小组副主席。任杂志ArtificialIntelligenceinMedicine的编委,JournalofHealthInformaticsResearch的编委,SmartHealth的编委,DataMiningandKnowledgeDiscovery的执行编委,PatternRecognition编委。已在美国申请相关专利40余项,授权15项。
演讲主题:人工智能与智慧医疗——现状、误区、挑战及发展方向
演讲概要:人工智能正在改变着这个世界。医疗健康,作为每个人生活中不可分割的一部分,也正在被人工智能改变着。全球的IT巨头,例如Google,Microsoft,IBM,以及国内的IT巨头BAT,都在试图用先进的人工智能技术来提高医疗质量,让每个人变得更加健康。本报告将对目前人工智能技术在医疗中应用的现状做以小结,指出这一领域的常见误区及挑战,进而展望未来的发展方向。
韩玫
谷歌资深科学家
韩玫,谷歌资深科学家。她已发表超过30篇有关视频分析、视觉跟踪、物体检测、几何建模、图像处理、计算机视觉、多媒体处理以及计算机图形学的会议论文。拥有20多项美国专利。加入谷歌之前,韩玫曾是美国NEC实验室研究员。韩玫本科、硕士、博士毕业于清华大学计算机科学与技术专业,并于2001年获得卡内基梅隆大学机器人学博士学位。曾担任3DV2016,CVPR2017和ACMMultimedua2017的会议组织主席。
更多嘉宾将陆续揭晓,世界人工智能大会门票火热销售中,请点击“阅读原文”抢票。
博客地址:https://lukeoakdenrayner.wordpress.com/2017/10/09/the-end-of-human-doctors-the-bleeding-edge-of-medical-ai-research-part-3/
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。