人工智能在医学图像中的应用:机会与挑战
撰文 | 潘毅(美国乔治亚州立大学州校董教授,计算机科学系主任)
● ● ●
医生采用医学图像来诊断疾病已近数十年了。采用深度学习处理并识别医学图像是非常自然的应用,由于医生的人工成本较高而计算成本较便宜,因此采用深度学习处理这些图像是一种经济的方式。
人工智能是模仿人类智力和行为的科学。机器学习是人工智能的一个分支,它可以训练机器如何使用算法或统计信息来查找隐藏的认知并自动从数据中学习知识。深度学习是机器学习方法的其中一种,它使用一些先进算法(例如自动编码或卷积)并把它们应用到深度神经网络,从而达到识别数据模式的目的。由于现在的很多应用产生了海量数据和强大的超级计算机的存在,深度学习最近变得非常成功。正因为深度学习的飞速发展,语音和面部识别、图像分类和自然语言处理等许多应用研究有了突飞猛进的提升。
医生采用医学图像来诊断疾病已近数十年了。采用深度学习处理并识别医学图像是非常自然的应用,由于医生的人工成本较高而计算成本较便宜,因此采用深度学习处理这些图像也是一种经济的方式。目前主要有三种类型的医学图像。放射线图像由MRI图像、X射线图像、PET和CT图像组成,它们显示器官水平的一些特征。放射科医生通过读取这些在胶片上的图像,从而发现诸如黑点等特殊特征来诊断疾病。组织病理学图像可以通过显微镜获得。这里我们可以使用扫描仪捕获整个载玻片上的图片,再将其保存为包含组织和细胞水平细节的数字图像。病理学家使用显微镜观察载玻片上的染色标本,也可以通过观察保存好的数字图像,来进行疾病诊断。
分子图像是通过电子显微镜获得的,能够显示分子水平的细节,例如重原子附近的轻原子或细胞内可测量的键长。分子成像与传统成像的不同之处在于生物标记物可以显示特定的疾病靶标或途径。组织病理学图像和分子图像是用侵入性方法获得的,而放射学图像是非侵入性的。用于MRI、X射线、PET和CT图像的机器学习算法可以用来补充放射科医生的意见,而用于病理组织学图像的计算机算法可以用来进行疾病检测,诊断和预后预测,以补充病理学家的意见。分子图像还可以帮助生物学家识别疾病的生物标志物并用于检测疾病,例如癌症。除了改善疾病的诊断能力外,人工智能技术还通过优化新药的临床前和临床试验来改善这些疾病的治疗。疾病进展预测和更早更准确的诊断意味着可以节省更多的医疗费用和拯救更多的生命。因此,人工智能技术具有重大的经济和社会效益,最近颇受关注。
作为人类,医生会从教科书或他的老师或同事那里学习哪些特征对识别疾病很重要。如果他的知识不完整或教科书中的知识不完善,他就会犯错误。然而,机器学习可以通过训练来学习未知知识并自动发现新的重要特征。在深度学习中我们可以同时优化特征和分类器,从而产生非常好的预测结果。除了特征提取和分类,机器学习算法还可以执行去噪、分割、配准、聚类和诊断等操作。经过训练的人工智能系统(例如神经网络)可以快速并经济实惠地执行疾病诊断。如果人工智能系统也可以在预测精度方面做得更好,那么在将来的诊断中采用它几乎是毋庸置疑的了。
但是,我们仍然需要克服许多障碍才能使人工智能发挥它真正的潜能。除了人工智能中常见的问题(例如训练时间长,内存需求大以及隐私和安全性问题)外,它们还有几个独特的问题需要解决。
1. 人工智能需要大量的训练数据才能获得良好的预测模型。但是,医学图像数据很难获得,并且由于其高昂的生产成本,人们不愿意共享。这也许是让医学图像数据成为知识产权和商品的时候了。
2. 由于需求不同,每个领域都需要不同的模型,并且没有通用的理论来指导模型和参数的选择。它仍然是一门反复试验的科学,就像缺乏科学和理论的“炼金术”一样。所以发展一整套理论来指导实验,减少试验次数或优化系统,是一个很好的研究方向。
3. 由于不同的数据源具有不同的优势,并且融合后的最终结果通常会更好,因此提出了比单模式更好的多模式学习模型。例如,要诊断特定疾病,我们可以使用MRI,功能性MRI、CT、组织病理学图像和分子图像以及基因组数据,生物芯片数据和医生认可的图像特征等多种数据源进行独立的预测。当融合这些独立的预测结果以获得最佳结果时,我们要求这些数据来自同一组患者。这就要求我们同时使用不同的方法对这些患者进行测试,这对任何一家医院来说都是一项艰巨的任务。测试必须用同一个患者群体很容易理解,为什么也要同时进行呢?因为不同时间,一个人的疾病会发展或消失。
4. 当前的人工智能(如深度学习)是一个黑盒子,人们可以获得预测结果,但是不知道结果是如何获得的。理解预测过程和获取其推理规则是下一个重要研究主题。预测结果是由于X射线图像上的黑色区域还是光滑的圆造成的呢?所以可解释的人工智能对于用医学图像来诊断病情尤其重要。
5. 如何在人工智能系统中利用人类经验是一个棘手的问题。人工智能专家如何将医生掌握的先验知识注入到深度学习系统中以改善预测结果呢?
6. 最后,在使用医学图像预测疾病方面还存在一些法律问题。像医生一样,人工智能哪怕有99%的准确率,它有时候也一定会犯伤害患者的诊断错误。由于法律还不成熟,因此人工智能的诊断错误决定很有可能会引起法律诉讼。因为没有政府的支持和相关的政策,医院不太可能在不久的将来部署商业人工智能算法作疾病诊断。目前,人工智能系统仍被用作为疾病预测的辅助工具。但在不久的将来,当人工智能在相关法律的保护下并产生比医生更高的诊断精度时,人工智能系统用于疾病诊断和医疗卫生的梦想就一定可以实现。这些挑战同时也为计算机科学家和医疗保健领域人士创造了大量研究和发明的机会。
本文收录在 Springer AI核心技术前沿专题页面,限时开放领域精选期刊论文与图书章节,还有专家独家文章,浏览更多精彩内容。
作者简介
Prof. Yi Pan
Georgia State University
潘毅,1977年以江苏省理科状元考入清华大学计算机科学与工程系(1978年3月入学)。1982年和1984年在清华大学获得计算机工学学士和硕士学位。1991年在匹兹堡大学获得计算机科学博士学位。目前是乔治亚州立大学计算机科学系主任,州校董教授。他的H-指数是70,也是多个杂志的主编和编委。
注:本文转载自 Springer。