新闻中心

中国工程院院士胡盛寿:智慧医疗离得既近也远

作者: admin 来源: 更新时间:2018-09-23 点击数:
    9月20日消息,今日上午,2018深圳国际BT领袖峰会和生物/生命健康产业展览会在深圳会展中心5楼梅花厅正式拉开帷幕,此次峰会以“引领精准医疗,共享健康生态”为主题,共设两大主题演讲、一场高端对话、四场专业论坛、五场同期活动,解读全球生物医药行业最新市场趋势和最前沿的技术发展动向,为促进全球医药健康科学、技术和产业发展,搭建高端、前沿、开放、全面的交流平台,展现生物医药产业全新活力。
 
    会上中国工程院院士、国家心血管病中心主任、中国医学科学院阜外医院院长胡盛寿发表了主题为“智慧医疗——离我们很近,也很远”的演讲,以下为演讲实录:
 
    胡盛寿:先生们、朋友们,大家上午好!很高兴受邀在这里进行演讲,我是一名心脏外科医生,心脏动脉搭桥手术、心脏移植是我的专业,我同时作为国家心脏中心的主任和心血管重点实验室的主任,在健康大数据和智慧医疗这个领域里,我们做过很多探索,所以非常高兴有这样的机会在这里和在座各位就我们的粗浅认识和大家进行分享。
 
    我演讲的题目是“智慧医疗——离我们很近,也很远”。首先说智慧医疗似乎离我们很近,为什么这样讲?如果我们自己要在Google查阅一下最时髦关键词,出现频率最高的关键词,大家一定会发现,以下这些关键词搜索的频率会非常高,特别是大数据,包括人脸识别。在这些关键词频繁出现的背后,预示着我们国家在大数据、智慧医疗领域里已经发生了深刻的变化。但是我们要问,大数据或是基于大数据的智慧医疗兴起的背后如此的热门,我们怎么看待?大家可能要问,这一次的人工智能热潮炒得很热,不光是专业领域,老百姓的心目中也产生了非常大的共鸣,主要得益于有一件事情在老百姓、专业人士中都产生重要影响,就是Alpha Go。2016年Alpha Go学习人类的棋谱,以4:1战胜了韩国最知名的九段棋手李世石。2017年5月Alpha Go Master问世,实现人类棋谱自我对弈,3:0战胜我们国家顶级九段棋手柯洁,第三盘输的时候,柯洁流下伤心的眼泪,这个画面影响很多人。2017年12月Alpha Go的升级版zero出台以后,和上一代Master进行比拼,100:0完胜上一代,预示着人类的智慧在和所谓计算机的智慧之间的较量中给我们打开了完全不同的一扇窗。
 
    人工智能迅速得到各国的关注,2016年10月12日白宫发布《准备迎接人工智能未来》,2017年7月8日国务院印发新一代人工智能发展规划,金小桃主任就是这个项目很重要的执行方面,各大院校对于人工智能的关注更是风起云涌,北京大学、清华大学、南京都建立了人工智能专业,人工智能甚至已经进入了中学的教材。人工智能在医疗领域也取得了很多的进展,比如说科大讯飞智慧医疗的助理医疗参加2017年国家执业医师资格考试比试,排名前5%。天坛医院进行人机大战,准确率远远超过医生们的答卷。
 
    其他很重要的专业杂志、顶级期刊,过去几年中,智慧医疗成为发表最重要论文的领域,美国FDA已经审批通过12个泛AI医疗产品进入临床,比如说Apple Watch 、Dr Master。大量的企业纷纷踏入这个行业,百度大数据医疗,阿里健康,似乎智慧医疗离我们很近,但是我们要看到另外一面,它又似乎离我们还有一段距离。
 
    比如说智慧医疗昔日的老大Watson肿瘤诊断在全世界范围内,所有使用最广泛的智慧医疗工具,Watson在jeopardy节目上打败人类,2016年Watson诊断罕见白血病只花了十分钟,2018年Watson的股价持续下跌,健康部门裁员70%,一方面是工具初步得到了认可,一方面是他们的产业自身发展的艰难,形成了很大的反差,可能人们要问为什么。中国的情况也是一样,医疗人工智能产业雷声大雨点小,落地非常困难。智慧医疗市场规模,2018年超过200亿,新成立的公司不断出现,医疗人工智能的热度不断高涨,到目前为止国内还没有一款真正的智慧医疗的产品通过了FDA的认证,用于到临床。
 
    我们要问为什么,这里我想从三个方面,就我们自己的认识和在座各位做分享,智慧医疗的产业链条中包括三个非常重要的环节:一是研发;二是应用;三是评价监管。研发到应用,应用反过来促进研发,评价和监管始终贯穿研发到应用的全生命周期。我们首先讲一下研发。
 
    讲到智慧医疗的研发自然提到数据,数据、算力和算法这是智慧医疗的三驾马车,我们首先讲一下算力,也就是我们通常所说的硬件,应该说在过去的二三十年中,计算机技术的硬件已经得到了长足的发展,无论是从CPU到现在的GPU,它的硬件应该讲是快速的发展,还在不断的更新,比如说并行计算,技术得到了非常大的跨越,硬件发展的速度非常快,为智慧医疗奠定了所谓的物质基础。
 
    但是我们不得不看到,目前使用的主流深度学习计算机平台均是国外公司开发的,需要将数据上传到云端,自然存在数据全方位安全性的问题,东西都存在云端别人的手上。广泛的基层医疗机构,医疗设施、信息化水平,还相距甚远,简单的话讲,基层医疗机构用不起智慧医疗产品,第一代、第二代、第三代,硬件设施的进步在大多数的基层医疗机构有多少具备这个条件?
 
    二是算法,概念和算法的不断进步是人工智能发展的软件基础,从最早的人工智能到机器学习,再到当下的深度学习是在不断演进,而且演变的过程实际上是充满了争议,而且充满了不可预知。软件的开发和相对的硬件成熟形成了非常大的反差,其实我们现在所说的机器学习、深度学习只是整个人工智能软件开发中的几个小的分支,从这个意义上讲,我们在算力、算法方面还有很长的路要走。
 
    人工智能的学习我还要讲另外一个话题,人工智能的学习和人脑的学习是完全不一样的,比如说图像的对称学习,以这个为例,人类只需要临床医生几十张图的训练,基本上有可以大致发现规律,但是从深度学习来讲,计算机则需要上万图像反复的训练才能得出这种结论。
 
    这个图可能在座的有些人见过,人工智能的核心,核心的问题与毫无相关混杂的因素常常会使人工智能造成混乱,肉眼看两张图是没有差别的。肉眼无法分辨的几个像素的改动,无法影响人类,但是让人工智能可能会做出错误的判断,这就是现在的人类和智慧医疗之间从软件的开发角度不可忽略的路径,我们怎么跨过?人工智能的学习原理仍然处在所谓的“黑箱”状态,成为医疗落地的障碍问题,时间的关系我不展开讲,比如说深度需要到底学到什么,是如何学习的?我们知道吗?
 
    智能医疗产品的诊断依据到底是什么?比如说人工智能,比如说医生得出诊断结果,它是怎么出来的?我们如何监管它?出现错误如何修正?产品上市以后能否学习新的数据和自我的进化?这都成为人工智能中我们看不见的东西,它是黑箱操作,这个意义上讲,我们人类如何掌控它?
 
    我再讲另外一个要素就是数据,这张图能很好的说明大数据的海洋里,人类现在得到数据的量级,从它的完整性和系统性上讲只是凤毛麟角,比如说我们常见到的Watson和前不久开发出来的眼底疾病的诊断,仅仅是依据临床信息中的影像,临床中只占30%,临床信息中的百分之几是所谓的影像数据,也许是百分之零点几的数据产生Watson,你说它能正确的判断肿瘤疾病的产生?从数据的完整性、系统性的角度讲,现有的智能产品失真的可能性有多大?可想而知。
 
    智慧医疗的核心就是数据的要求,我们还是讲IBM的Watson,它与MSK肿瘤中心专家合作四年,完成60万份临床病例标注,现在还有专家不断更新数据,我们国家张康教授团队在CELL杂志上发表人工智能用于诊断眼底图象的文章,研究团队获取20万OCT图像,初筛后淘汰一半,经不同级别医生三轮的注视用于机器的学习,这个过程很漫长,处理图像只是很小的一部分。
 
    最后是要采取工具和人的使用,各类比赛用的人工智能完胜医学专家至今却是没有一个人工智能用于临床,国内做了很多,包括卫生部考试中心做的模拟的,我记不清山东还是浙江做了一个考试系统,一个是机器、一个是人参加同样的考试。训练和比赛用的一套数据题,相当于提前放出题库,考试只是考的原题,训练场景没有经过清洗、标注,实际应用场景数据是千差万别,参差不齐的,这个意义上讲,两者之间没有什么可比性。换句话说,所谓的机器打败人类,后面是偷换了概念,从数据的角度讲,两者之间根本就没有可比性。
 
    国内临床医疗数据可利用率低下,这是我们不可回避的事实,高危筛查项目对全国3602个机构全方位进行分析,数据之所以可以用,它与结构化、电子化的程度统一规范是紧密相连的,缺了这个数据再多也是垃圾。
 
    数据的完整性和真实性在我们国家是堪忧的,我这里讲的内容比较多,时间的关系不能展开。比如说诊断行为不规范,信息产生、采集的错误百出。我是一个心脏外科医生,也是一家医院的院长,我们电子病例经常查,全国很多医院,非常知名的医院,抽查门诊病例,合格率能达到50%到60%已经相当不错了。经常在医院性别搞错了,比如说很多医院说男性有月经史的情况,这种比比皆是的错误,基于这种错误能作为未来医疗的智慧数据采用吗?医疗机构为保证医疗质量、漂亮,并发症、死亡率数据的失真是不可回避的客观事实,医疗、社保、安全系统信息的不互通仍然造成我们很多的数据孤岛,信息的敏感性、信息孤岛现象在当今医疗领域里其实是非常普遍的现象,如果说用不真实的数据培育、产生出来的智能产品大家可以想象,很可能不仅是贻笑大方,很可能是产生更加危害的结果。
 
    所以数据是关键,数据是智慧医疗的核心,基础不稳没有真实的数据做依托,你产生出来的产品一定是效率低下甚至可能是贻害大方的。从这个意义上讲,本来国家心脏中心、和深圳市政府要签一个合作协议,和社保数据库系统、医院数据库系统,开发基于大数据的基层医疗卫生服务能力提升的命题,我们团队联合耶鲁大学和牛津大学的团队一块对深圳的三大数据库系统进行初步的观摩,实际上发现这中间数据的可利用程度实在是堪忧的,数据的标准化、规范化完全不一,很多人说我用了多少数据,如果数据不是真实、不是完整的、标准不是统一的,它不叫数据叫条目,所以要从底层完善数据的标准化、结构化、规范化,是成为智慧医疗最关键的基础。
 
    第二,应用,智慧医疗产品,任何一种产品的应用发生在患者之间形成的关系,我们的智慧医疗工具可以辅助医生,也可以间接的辅助患者,同时医生又可能成为监督智慧工具的方面,三者间到底是什么样的关系?很大程度上要取决于应用过程中不同产品在不同场合、不同的领域、不同的疾病中确定相互关系,没有一个是可以公用的。这就构成在应用领域里使用更加复杂,而应用的过程决定了这个产品是否有价值。
 
    从临床应用的角度看,有很多的问题远远没有解决,需要反复的临床实验确定,什么才是正确的应用?我们在使用某一个工具,不是所有人拿在手上多能用,怎么用?什么是正确的使用?这个产品什么是他的合理使用范围?应用的流程和路径应该怎么样确定?如何建立检测手段和标准?都成为应用中我们必须系要去跨越的,我们必须要解决的问题,才能促进产品真正的健康、有效率的使用。
 
    美国过去几年中,美国FDA对AI的产品认证已经初步形成一个流程,无论按照一类、二类、三类产品申请,初步形成了一个流程,其中很重要的是要确认原来产品中的可对比性,按照分类标准确定一、二、三类,不同类别的产品进入不同的路径审批。美国FDA批准12个泛AI的医疗产品,PMA还有510K等效的医疗器械,还有De novo的新分类,12个泛AI的医疗产品中,仅有两个是按照三类医疗器械审批,其余做了类化和简化,也是初级版的初级阶段。
 
    举一个例子关于IDx-Dr,主要是检测糖尿病、视网膜眼底病变的筛查软件,输出最后的结果,检测到高精度的糖尿病视网膜病变,转诊至专业人士,未检出高度的视网膜病变强行要求做复查,图像不清楚的一定要排除在外,他是只做诊断不做治疗,严格限定应用场景。
 
    临床评价来讲,2012年到2014年,美国五个中心600例随机前瞻性的对比研究,2017年做了多中心非随机的横断面的观察性研究,然后再去预测、发现软件或是智能工具,在哪些场合应用、哪些层面应用的敏感性、准确性,最后得出结论,只适用于初级的筛查。
 
    IDx-Dr 软件的批准过程,首先是要做突破性资格申请;二是软件认证预确认;三是临床试验;四是重复性研究,24个人各10次,达到99.6%的一致性;五是图像采集培训课程认证;六是厂家制定会引起产品重大变更的技术规格特征。审批的过程花了将近七年的时间,还不包括研发。
 
    一个人工智能产生远非我们想象那么简单,国内至今还没有一个人工智能、智慧医疗的产品进入临床,也没有相应的审批途径,在这里面刚刚开始讨论,长春长生疫苗事件,开了一系列的研讨会,是我们如何应对人工智能产品审批的问题,2018年8月1日真正开始,发布《医疗器械分类目录》新设泛AI类产品注册,不给出结论诊断的按照二类医疗器械管理,并能提供明确诊断,对其风险进行相对比较高的识别,把它列为三类医疗器械,仅仅是刚刚开始,还是专家层面参考FDA的讨论版,它到底适不适合我们国家的现状?是不是正确审批的途径?现在打了大大的问号,无论是国家层面还是政府官员层面。
 
    智慧医疗的评价其实不仅包括产品上市之后,研发开始,数据层面要对它进行监管、评价,算法层面上也要对它进行分析、监管,最后它用到患者进入临床实验的时候必须要进行所谓的临床评价,三个环节我们设想一下,我们对AI的监管能力,观念、行为、路径几乎是个空白。
 
    基于上面的认识和大家分享一点体会:
 
    医疗人工智能我们还有很长的路要走,如果把算法和数据的有效性作为横坐标,我们国家尚处在初级阶段,第一阶段是数据整合阶段我们还没做完,美国进入了第二阶段,数据的共享和感知智能。第三个阶段是认知智能+健康大数据,形成基于大数据智慧医疗产品临床的应用进入现实的医疗健康产业中,中美医疗智能反战的差距,心血管大数据层面来看,现阶段在于数据的有效性方面我们还有很大的距离。
 
    发展人工智能,既看到我们有很大的弱点和不足,另一方面我们又有很大的优势,全球领先的互联网产业在深圳,比如说腾讯、华为,比如说微信、淘宝我们走在世界的前列,已经积累了相当的资源和能力,加上13亿人口,庞大的市场资源和需求,政府层面的大力支持。金小桃主任讲的来自政府很多的政策指导思想等,都为我国的人工智能发展提供了广阔的前景。
 
    我是临床医生,讲讲现场的需求,大家都知道大医院人满为患,我们国家医疗改革很重要的是要解决医疗配置合理的问题,优质医疗资源下沉的问题,解决基层服务能力的问题,大部分的常见病基层医生可以诊断,我们如何提升基层医生的服务能力,还是对基层全科医生进行培训吗?猴年马月能把家庭医生、基层医生培养成让患者相信的基层医生呢?传统的路显然是有很多问号或是走不通,我们需要借助基于健康大数据的智慧医生系统。
 
    还是回到Alpha Go的例子,比如说中国的高血压患者已经超过3个多亿,难道所有的高血压病人都需要到大医院的门诊就诊吗?基层医生、家庭医生很多人都不相信,我们开发了1.0版的高血压医生,设想一下两三千种的高血压药物,药代学、药动学的量多大?哪个聪明的医生可以记住,患者来讲,个人的信息、家庭信息、遗传背景因素,大量临床实践积累起来的《指南》和对治疗本身判断效果得出的数据,三大类的数据集成在一块,产生智能的高血压医生,哪个大医院的高血压主任能够和它相提并论?这就是我们说的九段棋手和Alpha Go的较量。这个层面上,智慧医疗在改变基层医疗公共服务能力方面是大有可为的。一定要基于互联网和智能技术的有效结合,单个的数据产生开始,数据的收集再到基于数据产生工具,再到基于数据对智能工具的使用进行监管,现在是我们正在探索的模式,我们接下来到深圳就是要做这个事情,县级、国家级的数据中心,靠数据的结构化传输、集成产生产品,同时监测产品的应用,形成完整的链条才是未来改善基层卫生服务能力很重要的举措。
 
    解决人工智能的核心问题,我们现在是需要平心静气、扎扎实实的做好基础工作,以下这些方面我们都是刚刚开始,地基不牢出来的东西一定不会持久,甚至会误人子弟。基于数据的角度,国家卫生计生委出的电子病历系统,贵阳也开了会,大家可以看一下,别说基层卫生,大医院里的数据结构性、完整性和准确性都是严重不足的,打好基础的工作,做到数据的准确、完整、结构化我们的机器才可读,才能基于正确的数据产生正确的AI产品。
 
    算法,针对不同类型的数据需要探索合适的算法,不是一招先走遍全天下,我自己不是学计算机,相信在场有很多做计算的,这个领域里的空间是非常大的,还充满奥秘,很多都没有解决。再就是解决人才的问题,智能工具产生的时候,搞数学、计算的人,临床医生产生数据,还有做医疗评价的人,中间有一个一个需要我们跨越,培养复合型的专家人才是我们解决未来在中国能快速产生高效率的智能工具非常重要的不可或缺因素。
 
    我们需要搭建一个机制,各方面的人才聚集到一起,资金融入到正确的项目、正确人的身上,才能高效的产出我们需要的人工智能产品。从政府来讲,监管在一开始就要走在前面,再也不要置于背后被动的挨打,一个检查产生一个重大的事件倒一批官员,害了一批患者。我们需要走在前面,从现在开始,从产品的开始研发阶段,我们的监管系统就必须要进入。
 
    我们究竟需要什么样的智能产品?需求导向,核心算法的智能化,用户体验智能化,无论为创新、为医生、为病人还是为社会,它的价值、目的是不言而喻的。
 
    人工智能不是一个新话题,其实是一个老话题,不是一个新鲜事物,1956年就开始讲人工智能,我们经历了第一次浪潮和第二次浪潮,现在是第三次人工智能浪潮的到来,前两次起来一阵风浪很快过去,我们衷心的期待第三次浪潮的到来,真正形成可以持续影响我们国家基于大数据的医疗健康产业,这个领域我们国家应该有所作为,也一定能有所作为,谢谢大家。