智能已广泛应用于当代生活中,其火爆程度已让研究人员与投资者无法回避。最为常见的人工智能,例如iPhone的Siri,特斯拉的自动驾驶,智能语音客服等,皆通过机器学习这类统计算法来实现。与传统统计方法相比,机器学习的优势在于它可以处理数量巨大、特征繁多的数据;并基于学习过去的经验与知识,在遇到新的问题时,通过归纳出的解决方法来处理问题。
本文将探讨人工智能在关乎人类生老病死的医疗健康行业中的应用,重点讲述医疗影像识别中的优劣势及市场应用。
文/叶思奥
编/HLR,张璘,田雨
人工智能识别医疗影像的优势
传统上,医生需要通过病人的表观病征,生理检验结果等一系列数据对病情做出判断,而这一切都是可标准化的数据,可以交由人工智能进行处理。人工智能可以根据临床反应与生理指标,快速地调出可能对应的疾病,辅助医生进行判断。
与此同时,人工智能可以依靠其强大的搜索能力对海量的过往病例与治疗方案,以及文献进行检索, 提出完备的治疗方案。在针对罕见病的治疗上,这一特性可以弥补医生因经验不足而导致的束手无策。根据全球市场洞察(Global Market Insight)报告预测,医疗人工智能的市场将会在2024年达到100亿美元的规模,涉及诊断,治疗,预防等各个环节。
随着人们健康意识的提高,海量影像数据被飞快地产生,IBM的研究人员估计,大约百分之九十的医疗数据是图像数据。到2020年,我国医学影像市场的规模将达到7000亿人民币【1】,而如今医院往往缺乏足够的医护人员能正确而迅速地读取图片信息,因此对于能够快速处理影像数据能力的需求也十分巨大。
此外相比于人类医生,人工智能还具有如下优点。
1.判断更加准确。由于一些生理结构图像过于复杂,人眼往往难以识别出其中的特征,但是人工智能通过大量案例学习后能发现潜在的规律。斯坦福大学的研究者表明,他们开发的机器学习算法可以比医生更加准确的识别肺部癌变【2】。国内上海交通大学与浙江大学联合开发的阿尔法医生也获得了相似的结果,在更短的时间内处理了更多的图片,并且取得了95%的正确率,高于测试中的医生正确率约两个百分点【3】。就像资深医师因为看过众多图片而比普通医生的判断更加准确,人工智能可以学习大量的图片来提高自己的正确率。
2. 人工智能可以大批量快速地处理图像数据。只要计算能力充足,人工智能便可以一次性处理大量图像数据。更重要的是,人工智能并不会感到疲劳,可以24小时工作。相对的,人类医生在一天的工作中可能因为疲劳而产生错误。
3.人工智能可以处理图片的类型更加丰富。由于病症的种类繁多,从心血管疾病到癌症等均会涉及到成像与识别,一名人类医生很可能只擅长其中的一两种的图像识别,而不是全部精通。相反,计算机的高效性与大数据容量使其能够学习识别不同的病症图像,处理不同的图像种类。这样一个人工智能就可以取代多名不同科室的医生。
4.人工智能进行图像识别可以与病人的“大数据”相结合。人工智能可以不局限于病人的图片数据,而是结合其病史,遗传背景,家族病史等其他可以数据化的信息 。它甚至可以结合病人的饮食结构,生活作息等数据到模型当中,对病情进行更精确与个性化的判断与预测。IBM研发的沃森诊疗机器人就具备上述功能,它不仅可以快速读懂医疗影像,还能根据电子病例数据库进行分析诊断。此外沃森机器人还可以与病人进行对话来获得症状,日常习惯等信息,可以说在不久的将来就能实现机器人的“望闻问切”了。
5. 除此以外,人工智能还可以与“云”相结合,帮助医生远程进行图片分析。
比如某一地方医院由于人手不足而无法处理的图片,可以上传到云端进行分析,再把结果返回到本地,进一步释放了医生的生产力。我们甚至可以预测,在将来的某一天,成像设备可以直接把获取的图像传到医院以外的某一处处理中心,一个中心可以帮助多家医院进行图像处理,并把结果反馈给医生,同时图像数据也可以保存在云端,免去携带实体影像的麻烦。
人工智能识别医疗影像的挑战
为了获取高正确率的预测,机器学习模型需要大量的训练数据,这就涉及了以下挑战:
1.均一化数据获取。人工智能算法开发人员首先要面对的是从何处获取足够的图片数据来训练自己的模型。虽然国内医院产生了很多的图像,但很大部分并非数字化图像,而数字化图像也需要经过医院同意以及匿名处理才可以使用。
2.偏差性。如果获取图像的来源过于单一,可能会导致模型的预测结果有偏差。这是因为不同医院使用机器不同,放射剂量不同,因此面对相同的病灶所得的图像可能也有不同。所以用某一医院图像数据训练出来的模型去分析另一医院的图像,准确率可能会大幅下降。解决这一问题的办法就是尽可能使数据来源多样化,避免内在的偏差(bias)。
3.数据共享。由于我国医院多独立运作,现阶段缺乏统一的机制来协调共享图像数据,并且这些数据还需要采用统一的格式才能用于机器学习,因此各独立体之间缺乏意愿与能力来共享数据。
4.数据标注。即使获得了大量图像,由于不同类型病症对应的图像差异巨大,还需要对这些图片进行正确标注,才能使得机器学习模型能够进行正确地学习,而这一过程又需要大量人工。要知道,用于模型训练对数据量往往是数以十万计甚至百万计的,要对这么多数据进行标注,其难度可想而知。
5.法律法规。运用人工智能进行医疗影像处理的一大障碍是法律法规层面的不完善。毕竟计算机再智能,也无法保证百分之百的正确率,那么当误判发生,耽误了病人的及时治疗时,是医生,医院,还是负责提高图像识别服务的公司要对此负责?又要如何划分责任呢?此外由于信息被数据化了,也就存在外泄的可能性。一旦病人隐私被泄露,将引起新的麻烦。如今美国FDA正在着手规划人工智能在医学领域应用的标准,只要人工智能对使用者健康风险影像较小,就可以进行基本健康服务,但对于更加具体的疾病诊断的应用仍在探索之中。
人工智能图像识别的市场
在医疗上进行人工智能的诸多尝试上,能够率先改变现有医疗格局并商业化的莫过于人工智能在医疗影像识别中的使用,其中最主要的两个原因是1.图像识别本身的算法门槛较低,研究充分,且在许多其他领域有所运用,可以较为方便地迁移到医疗影像的处理上;2.医疗影像产生了大量的图片数据,数据结构简单,便于用作机器学习的素材。
根据Signify Research 分析师Simon Harris的研究,目前医疗影像市场中采用人工智能方法的公司有五十家左右,其中接近一半是近两年成立的,并且有超过三分之一的公司是在美国成立【4】。大部分的投资都在两百万到五百万美元之间,而2016年全年的投资在五千六百万美元左右。这些公司中大约一半的研究方向是全身多区域的影像处理,另一半则集中在特定区域,诸如乳腺,心血管等。
这些研究主要运用人工智能去解决以下问题:1.肿瘤探测。比如皮肤色素瘤,乳腺癌,肺部癌变的早期识别。2.肿瘤发展追踪。人工智能可以根据器官组织的分布,预测出肿瘤扩散到不同部位的概率,并能从图片中获取癌变组织的形状,位置,浓度等等。3.血液量化与可视化。通过核磁共振图像,人工智能可以更有效地再现心脏内部血液的流量变化,并且探测心脏病变。4.病理解读。由于不同医生对于同一张图片的理解不同,人工智能可以被训练用于解读图片,并向医生提供较为全面的报告,使医生可以了解到多种不同的病理可能性。5.糖尿病视网膜病变检测。由糖尿病导致的视网膜病变是失明的一大主因,而早期治疗可以有效减缓这一症状。人工智能可以辨认出处于早期的患者,并能根据图片像素判断病情的发展程度。
国际领先的人工智能医疗影像公司:
▲Zebra Medical Vision
Zebra Medical Vision公司主要开发基于云的放射性影像识别服务,顾客通过上传CT影像,可以在短时间内获得结果,其应用涵盖识别骨质疏松,肺气肿,脂肪肝,冠状动脉钙化等疾病的病情。公司产品已经实现了实时反馈功能,每张CT的解读价格也十分低廉,仅需1美元。目前公司已获得欧洲,澳洲等地方的官方许可,能在其市场里运营;其用于监测颅内出血的运算法也在欧盟获得了CE认证。
这家以色列公司在2014年成立,获得总共5000万美元的投资,其中刚在六月份完成的C轮由aMoon fund领投,共计3000万美元,在此之前的种子轮与风投轮则分别由Khosla Ventures与Intermountain Healthcare领投。公司的创始人与CEO Elad Benjamin有着20年的医疗器械与软件从业经历,曾担任多家医疗公司的总经理与副总裁职务,管理过初创公司与财富五百强公司。联合创始人兼CTO Eyal Toledano则有很强的计算机背景,获得麻省理工计算机硕士学位曾任三星以色利CTO两年,另一位联合创始人Eyal Gura毕业于沃顿商学院,在建立Zebra Medical Vision之前已是连续创业家,并是中东最大风投机构 Pitango Venture的一员。
▲Arterysi
Arterys是一家用人工智能对心血管影像重构的图像公司。其产品包括4D心脏血流监测,3D心室轮廓重构,心肌灌注图像等。通过与 GE公司合作,该公司开发了基于CT与核磁共振的算法重构三维心血管图像,经过FDA认证后Arterys的产品已在40家医院进行推广落地。这一产品能让医生快速获取心脏血流的速度与血量信息,对医生进行先天性心脏病,心脏瓣膜病等评估过程帮助巨大。
Arterys是一家2011年成立于美国旧金山的公司,目前共获得4370万美元融资,在去年11月份由淡马锡领投的B轮中获得了3000万美元,此前的种子轮与A轮则分别由Asset Management Venture与 Emergent Medical Partner领投。公司创始人Fabien Beckers是剑桥大学量子物理博士,并获得斯坦福大学商学硕士学位。他创立Arterys是为了提供数据驱动的医疗服务,而这依赖于精确的医疗影像结合分子、基因、病例数据。联合创始人兼COO John Axerio-Cilies是斯坦福大学的流体物理博士,在此之前专职于多种传感器与硬件的开发,另外两位创始人 Albert Hsiao和Shreyas Vasanawala则分别是心血管影像专家与核磁共振专家。
▲Enlitic
Enlitic的目标不仅在于图像识别,而是要结合病人的其他生理信息,从而提高诊断效率。通过深度学习,Enlitic的算法可以从过往大量病例中学习,再结合病人的图像数据,化验结果,基因信息以及病史等数据,来对病人进行诊断,并给出治疗建议。此外Enlitic还希望通过扫描大量医疗影像,筛选出潜在的病人,并报告给医生。
Enlitic 于2014年在美国旧金山成立,目前共获得1500万美元融资,在2015年的A轮获得Capitol Health Ltd.领投的1000万美元,种子轮则是Seven Peaks Venture领投。创始人Kevin Lyman曾在微软与SpaceX担任软件及硬件工程师,目前在Enlitic也兼任首席科学家。公司的另一位创始人CEO Jeremy Howard曾担任Kaggle(一家大数据竞赛平台)的主席与首席科学家,并创办了另外两家科技公司FastMail与Optimal Decisions Group,但是目前由于家庭原因已经离开公司。
国内领先的人工智能医疗影像公司:
▲汇医慧影
汇医慧影着力于开发独立第三方医学影像咨询平台,利用人工智能为医疗机构提供影像辅助诊断和阅片服务。公司已经与Intel及超过700家医院达成合作,平台上传的有效病例居中国同类公司之首。汇医慧影的影像云平台可以处理CT、核磁共振以及X光片,可以识别肺部、脑部、乳腺、骨骼等部位病变。 平台生成的报告不仅可以勾勒出可以病兆,也可以产生诊断意见。
汇医慧影成立于2015年,目前总融资额约3.35亿人民币,位居同类公司前列。在今年一月份的C轮融资中获得来自鼎晖投资等机构超过亿元人民币的融资,而此前B轮时达泰资本与蓝驰创投就已经投资超过亿元,此外其天使轮为水木易德投资。公司创始人柴象飞是荷兰阿姆斯特丹大学医学影像学博士,美国斯坦福大学博士后,曾在多家世界顶尖医学影像机构任职,有丰富的行业经验。另一位联合创始人郭娜则毕业于清华大学,曾就职于Google、Amazon、Apple、Intel、Microsoft等国际IT互联网企业。
▲推想科技
推想科技提供了针对CT与X光片两种辅助筛查产品,可以有效地筛查早期肺癌及识别心胸部其他20类病兆。推想科技的产品已经落地顶级三甲医院,AI提示系统被整合进医生信息门户中,医生只需上传影片即可获得初步诊断报告。公司还和多家传统IT巨头达成合作,将推想AI系统整合进入他们的医疗整体解决方案,其系统也被体检行业用于体检筛查。
推想科技成立于2016年,目前总融资额约4.83亿人民币,在今年3月份结束的C轮融资中获得了包括启明创投与红杉资本在内多家机构的3亿元投资,此前B轮中也获得高达1.2亿元人民币的投资。公司的天使投资人是英诺天使基金、臻云创投与吕传伟(快的打车CEO)。公司创始人陈宽曾在芝加哥大学师从诺贝尔经济学奖得主James Heckman 攻读博士学位,但是由于身在四川的姑姑罹患肺癌未能获得足够的医疗资源进行诊治,他决心改善中国医疗现状,选择了辍学创业,试图改善现有医疗数据低下的利用效率。公司的联合创始人兼CTO翁黄硕羽则曾在亚马逊担任软件工程师,并参与过UCLA医院的精准医疗建模项目。
▲Airdoc
Airdoc是一家提供医学影像识别与多模态数据分析的公司,除了CT与核磁共振图片外还分析光学影像图片与生理切片,并整合病史及环境因素帮助诊疗。其诊断病灶涵盖了眼部、皮肤、脑部、心血管、肺部、肝脏、骨骼、乳腺以及宫颈等,在2017年完成了200万例影像识别。同时公司也提供辅助诊断系统,医生可以远程提供病史与医学影像,获得诊断意见。
Airdoc成立于2015年,目前总融资额约为3.3亿人民币,在今年四月由复星领投的B轮融资中获得亿元以上融资,此前A轮获得搜狗的数千万人民币融资,天使轮则由九合创投与智朗创投投资。公司创始人张大磊有连续创业经历,曾创立郁金香挂号(手机挂号App)与若云兄弟(数字内容及教育类移动应用开发商)。
总结
人工智能在医疗图像识别上的运用才刚刚起步,其未来潜在的发展是巨大的,然而我们也要注意其中可能的障碍,以及不同市场对其需求的差异,比如不同领域对计算的需求是有差异的,避免可能带来的投资损失。考虑到国内外都处于相近的发展阶段,相信只要发展得当,国内企业也能在国际上取得领先地位,并且抢占全球市场。
参考资料:
1.2016-2021年医疗影像行业前景及趋势预测报告
2.
3.
4.Machine Learning?in Medical Imaging 2017