3月29日,在阿里云栖大会·深圳峰会上,ET医疗大脑正式上线。在浩如烟海的DNA序列中,比对识别出发生突变的基因位点;继承成百上千位影像学专家的“眼力”,在CT、核磁、B超或X光暗黑的器官/组织剖面成像上,捕捉毫米级的小病灶,时间可缩短至1分钟内……
这一切,并非科幻,而是多个科学团队,依托病例大数据,不断创新改良的复杂运算方法,和阿里云提供的开放式“天池众智”平台,赋予ET医疗大脑的“超能力”。
其中,针对甲状腺结节开发的影像学诊断系统,已进驻浙江大学附属第一医院等医疗机构“实习”,辅助那里的超声影像科医生阅片、捕捉甲状腺结节,并出具诊断报告。
至今,几个月的前期临床实践验证表明,成长于阿里云端的ET医疗大脑,可以用几十秒甚至更短的时间, 帮助医生完成一张甲状腺B超的阅片工作,圈出结节区域,并给出良性或恶性的判断。过去,有经验的超声科医生从阅片到书写诊断报告,至少需要20分钟。
在阿里云对其人工智能ET的赋能规划中,除了之前广为传播的“读心术”、魔术师、陆空交通指挥中枢、信息安全攻防外,医疗能力,尤其是对甲状腺、肺癌等现代社会高发疾病的风险预测、防控、诊治能力,显得更为重要、紧迫,也令人振奋。
“在多个疾病的(大数据运算)测试中,我们意识到机器能够深度学习并掌握人眼观察图像、识别差异的能力,并且能够与人类医生做得一样好!”阿里云智能科学家闵万里说,至少在一些可以将医学影像作为主要诊断依据的疾病领域,比如甲状腺结节,肺部结节,人工智能武装的机器人,“完全可以成为医生的助手”,并以低成本,快速的提高诊疗工作效率。
除了对CT、核磁、B超的医学影像诊断学习,阿里云还联合英特尔、和华大基因等来自计算机、生物医学领域的顶尖企业和创业公司,整合基因检测大数据,共同研究肺癌等疾病与基因突变的强相关性,试图通过ET的深度学习,精准定位导致疾病发生的突变基因位点(靶点),最终辅助医生为患者提供个体化的治疗方案,指导精准用药。
在阿里云的人工智能规划布局中,ET将具备多项医疗能力,可在疾病风险预测、医学影像诊断、精致治疗方案、药效挖掘、新药研发、疾病监测及健康管理等多个领域,担当“医生助手”。
在先期入驻阿里云ET医疗大脑的技术中,浙江大学孔德兴教授团队研发的超声影像的智能诊断算法是佼佼者。
突破:万份病历深度学习,“机器眼”比“肉眼”准确率提高25%
“智能诊断的基础,是大数据”,孔教授介绍,这套技术在诞生之前,首先对来自各类医疗机构的,1万张以上由经验医生准确标注(定位)结节位置的甲状腺B超,进行了深度学习。
在海量“记忆”的基础上,研究团队在运算系统中加入旋转不变性等现代数学概念,调整了卷集网络结构,让用于捕捉结节的“机器眼”变的更灵敏,用于判断结节良性或恶性的“机器脑”变得更“聪明”。
2016年,从浙江大学附属第一医院超声影像科开始,这项技术先后“入驻”火箭军医院、杭州市流霞街道社区卫生服务中心和一些在线问诊平台,开始对甲状腺结节的检出率和准确率进行临床验证。
多年来,甲状腺结节的主要诊断方法,是B超检查。在诸多医学影像检查手段中,B超成本低、检查地点/时间灵活、出片实时,但影像的收集和识别,严重依赖于医生的经验与手法,比CT、MRI等其它影像更难处理。
来自我国三甲医院的临床抽样调查显示,甲状腺结节的平均诊断正确率只有60%,多需患者切除结节后再进行活检(病理学检查),才能诊断结节是良性还是恶性。“如果不做活检,不同的医生常有不同的判断”,浙一医院超声科副主任赵齐羽坦言,结节的良恶性在B超片子上并非一清二楚的,一些良性的结节会带有恶性的特征,一些恶性的结节同样会有良性的表现。
然而,在前期的“临床试验”中,机器对约2000张B超图像中,甲状腺结节的检查率超过90%,良/恶性判断的准确率也高达85%以上。
“检出率和准确率的提高,大幅减轻了医生机械性重复的工作良,缩短患者等待检查报告的时间,尤其是改变了过去基层医院可以做B超,但缺乏诊断能力的困境。”孔德性接受透露,目前,杭州市西湖区西溪街道等多家社区卫生服务中心,都希望引进超声机器人,作为医生的诊疗“助手”
超声智能诊断工作,与医生为患者实施B超检查同步进行,智能诊断系统会自动地将图像采集下来,“捕捉”结节的准确位置,并在几十秒的时间内,比照深度学习总结出的一系列指标,判断结节是良性还是恶性,同步向医生出具报告。对这些运算结果的准确行,机器人还会自己赋予一个概率值,为医生最终的诊断,提供参考。
不仅是甲状腺结节,基于人工智能对人眼识别影像细微差异并做出判断的深度学习能力,阿里云平台上,又孵化出对肺腺癌基本特征——肺部结节的智能诊断系统。
阿里云算法工程师行湘介绍,人工智能诊断的原理,就是设计算法识别模型,赋予机器深度学习的计算能力;同时,收集大量有病灶位置准确标注的医学影像数据,训练机器的记忆比对和识别能力,最终代替医生阅读CT、核磁、X光,B超等医学影像,辅助医生做出诊断。
“理论上,全身各脏器的各类影像学图像及其它医学海量数据都有可能被深度挖掘。”行湘说。
聚合:通过有奖擂台赛 阿里云ET要集医学AI百家所长
“众智,才是最好的。”基于在电商、物流、交通、金融、信息安全等多个领域“打擂招贤”式比较研究的经验积累,阿里云推出“天池”平台,计划打造一个开放式的应用型人工智能“孵化”平台。
具体到ET医疗大脑的塑造与完善,考虑到医疗领域的专业壁垒,阿里云更寄望于“众智出英雄”。
顾斐,在哈佛大学医学院做博士后研究的年轻人进入阿里云,开始从事肺腺癌的基因突变“追踪”研究。
在顾斐看来,目前,国内从事基因检测,特别是癌症基因测序的机构很多,但解读探究DNA序列片段的方法,偏向统计学。但在像谷歌、IBM这样的国际顶尖互联网科技企业,已经通过大数据运算能力,和人工智能机器的深度学习能力,结合大量的基因检测样本,去研究预测疾病与基因突变的关系。
“通过机器对大数据的深度学习,搞清楚哪个(基因)突破的位点,与疾病的发生有强相关性——这种研究的应用前景是,可以对疾病的风险进行预测,可以通过靶向指标诊断疾病,还可以给予精准的个性化的用药指导。”回到中国前,顾斐研究了国内的医疗人工智能格局,最终,综合计算能力,和平台的包容性(对大数据的存储能力和存储效率),选择进驻阿里云ET医疗大脑,开展他对肺腺癌防治的深入研究。
过去18个月,阿里云与英特尔、华大基因合作共建的精准医疗项目BGI Online也在做这方面的探索。
此前,华大基因、阿里云和安徽医科大学共同宣布,在21小时47分12秒内完成了1000例人类全外显子组数据的分析。40年前,人类若想对埃希氏大肠杆菌进行全基因组测序,需要1000年的时间。
“在系统架构上,我们将ET医疗大脑设置为一个开放的人工智能系统。阿里云自身有大量的医学与人工智能科学家投入到研发当中,但我们更希望能吸收外部精良的算法与医学经验,只有如此,ET才能集百家所长”,闵万里说。
与正式推出ET医疗大脑同日,阿里云宣布,联合英特尔、linkdoc(零氪科技,一家致力于肿瘤大数据研究的创业公司)启动天池医疗AI系列赛,启动为期三年的医学AI算法众智比赛。第一季比赛,围绕全球第一高发恶性肿瘤——肺癌展开。
阿里云大数据孵化器——天池平台负责人王一婷介绍,在国家卫生计生委的指导下,通过与全国20多家大型肿瘤医院基于医学研究战略结盟,天池将为这一季的众智比赛,提供海量的脱敏后高分辨率胸部CT扫描数据。
根据赛事设计,参赛选手/团队需要通过整合原始的CT影像数据,训练模型算法总结提炼结节特征,最终实现对快速阅读、分析CT影像图片的能力,并对肺部结节做出智能化的捕捉,和良/恶性判断。
“通过这样的众智比赛,我们希望选拔在医学人工智能领域有计算能力和创新模型的优秀工程师/研发团队,进驻阿里云ET医疗大脑,共同挑战肺癌等发病率不断攀升,对人类健康威胁越来越大的疾病。”王一婷说,对众智比赛中脱颖而出的参赛者/团队,天池平台不仅提供高额的奖金,还将提供多种软、硬件的“孵化”服务。
具体到ET医疗大脑的研发,闵万里介绍,聚集在阿里云端的科学家和开发者,不需要自己去总结疾病诊疗规律(也就是对解题方法进行编码),而是通过海量的脱敏病历数据作为示例,来训练机器完成特定的深度学习任务,自己“摸索”出解题方法。科学家要做的,是优化算法和提供大量的训练数据。
去年,上海华山医院宣布,借助阿里云的能力,用数字化模型代替部分临床实验,以及模拟小白鼠的活体实验,加快特效药的研发。
左布啦希望,以医学AI算法众智大赛为契机,吸引更多医疗机构、医生群体,以及医疗政策制定者对人工智能诊疗的关注,共同推动行业变革。
而顾斐的理想是,能够与来自各地的人工智能科学家和生物医学专家一起,在阿里云上,设计搭建一个用于重大疾病预测,和后续精准诊断、治疗、以及可实现个性化用药指导的知识学习模型。
“这个模型,要比世界上的主要模型算法更为精确。”顾斐说。