人工智能如何帮助我们读取体内的生物钟信息?
编者按:生物钟已经被证明深度参与人体的健康和医学,包括显著影响心脏手术和癌症治疗后的康复效果等。最近,AI算法被用到了生物钟的研究中,帮助科学家更有效地读取人体内在的生物钟信息。
撰文 | 吴刚(美国辛辛那提儿童医院博士后)、张二荃(北京生命科学研究所研究员)
责编 | 陈晓雪
● ● ●
生物钟不仅与物种进化息息相关,而且也与我们人类的身体健康密不可分。在生物钟的调控下,人体中的代谢、内分泌,以及个体行为都呈现着昼夜周期。近年来的研究进一步表明,哺乳动物的生物钟调控着基因组中高达50%的蛋白编码基因,这一发现在人体生理学及药理学中有着广泛的应用前景,并促进了新兴的生物钟医学(circadian medicine)发展 [1]。
生物钟医学,旨在基于人体生物钟的研究进而开发出更安全、高效的疾病治疗方案。在近期的研究中,已有科学家发现,生物钟显著影响着心脏手术 [2] 和癌症治疗后的康复效果等 [3]。
尽管如此,生物钟的时间效应在医学实践和药物开发中经常被忽视。一个重要的原因是我们难对人体样本进行时序(time-course)取样,这样也就无法对人体的生物钟调控的分子机制进行深入研究。生物钟研究所使用的传统模式对于人体研究是不切实际的。我们很难想象连续24~48小时对人体多个组织进行多样点的时序取样,并分析各个基因、蛋白、代谢分子等随时间推移而产生的周期性变化。
本周三,美国辛辛那提儿童医院的一项工作为系统分析人体生物钟调控的分子机制提供了新的思路[4]。Hogenesch实验室运用当下最流行的机器学习(machine-learning)或AI技术为基础的CYCLOPS算法,选取了来源于632位捐献者的13类组织样本,在没有取样时间信息的条件下重构了这些样本的取样顺序。通过对时序重构的组织的解析,研究者发现基因的周期性表达在人体中普遍存在。在这些周期性表达的基因中,有近千个基因编码的蛋白为药物靶向分子,参与药物转运或药物代谢(图一)。这一研究为昼夜节律在医学中的应用提供了宝贵的资源,并提示了时间维度对于药物治疗效果的重要性。比如,在睡前服用硝苯地平(Nifedipine)将会比起床后服用取得更好的预防和治疗冠心病之功效 [4]。
然而,将生物钟医学应用于人类疾病的诊疗仍面临着另一个亟待解决的问题,即如何准确读取人体内的生物时钟信息。人体内在的生物钟与其自身所处的外在24小时的周期性变化环境有可能不契合(例如时差、倒班、手机等现代化电子产品的过度干扰),造成人体不适或者危害健康。
今年年初,张二荃(本文作者之一)实验室在PNAS杂志报道了一种基于光纤记录的方法,长程、实时检测活体实验动物的脑钟基因表达 [5]。该系统能够很好地在动物身上监测生物钟,但由于其需将病毒导入报告基因、光纤插入大脑等侵入性(invasive)的特点,所以不能运用到人体生物钟的检测。理想情况下,人体实验应该(A)采用非侵入性(non-invasive)的方法;且(B)需尽可能减少取样次数和时间,降低受试者的痛苦和实验成本。目前临床检测人体生物钟的标准做法是通过监测人体内褪黑素浓度变化(dim light melatonin onset assay, DLMO),要求受试人员持续24小时坐在暗室,每隔30分钟取唾液样品,用以检测其褪黑素的一个完整昼夜周期的变化。该方法满足(A)条件,但对(B)而言几乎完全不满足。随着生物钟研究向临床转化方向偏重,如何解决这个问题就愈发显得重要了。
今年以来,有两个实验室独立在此方向实现了阶段性的突破:德国柏林Charité大学医学院Kramer实验室在the Journal of Clinical Investigation杂志(6月28日上线)[6] 和美国西北大学Braun实验室在PNAS杂志(9月10日上线)[7] 各自发表了研究论文。这两个工作与第一篇文章的思路基本一致,即运用AI技术,通过少量已知时相样品的学习掌握了十几个到几十个钟控基因的相对表达丰度,然后推广到检测人群,从而对真正的受试者仅采一个或两个时间点的血液样品,就可以基本判定其内在的生物钟状态,时相精度达到1~2小时(图二)。
这两项工作的关键是一套行之有效的AI算法。该方案最初来自于当时在美国加州大学旧金山分校Hughey等2016年在Nucleic Acids Research发表的ZeitZeiger算法 [8]。Hughey等人用的是小鼠时序取样的数据,包括12种小鼠组织,每一组织涵盖24个时间点的转录组数据,从而发展出这套算法。ZeitZeiger算法的初始成功在于作者先采用了已发表的大量小鼠基因表达数据进行“机器学习”。该算法经过改进,可以“学习”较少量的人体数据即可做出较为正确的判断,因而被用于Kramer实验室的这篇文章中;而Braun实验室的文章则采用自身开发的算法—TimeSignature(类似地,Hogenesch实验室的文章采用了CYCLOPS算法)。
两篇论文采用方法基本一致,实验目的也大体相同,即对受试者个人的内在生物钟检测用血液(钟控基因表达的相对丰度)指标为代表,用以评价此人内在生物钟的相位和振幅,基本满足我们对于健康人群的内在时钟状态的判断。其不足之处是没有考虑到各种不同组织生物钟变化在非健康人群中有可能与其血细胞的生物钟不一致。
►图二. Wittenbrink, N.et al., J Clin Invest一文中采用的操作流程图
总之,从今年的这三篇文章我们可以看到,研究者已经开始试图运用AI算法解决以前需要多时间点取样的问题,从而更加有效地读取人体内在的生物钟信息。不同之处在于,第一篇文章专注于各组织器官中生物钟控制药物靶点所在内在时相,从而推导出各类药物最佳服用时间点;后两篇文章则是运用人体血液中的单核细胞包含有生物钟信息的已知知识,帮助快速鉴定个体内在生物钟所处的时相。这些方法都运用到了RNA-seq为基础的基因表达组学信息,化耗时耗力的多时间点取样为多维多基因、单点(或双点)检测,降低了实际操作困难,为生物钟信息在临床上运用开辟了道路。
by 徐 璎(苏州大学CAM-SU研究中心主任、教授)
精准医疗一个非常关键点是获取个体的生物节律。
基因表达量在大部分个体之间的差异最大也就几倍,但在不同时间同一个体表达量的差异有可能达到百倍,所以就必须对时间依赖治疗手段予以充分考虑。以前,研究者们可以在动物身上通过间断时间对各种组织采样,或用生物钟的报告基因及活动节律作为动物的生物钟标记物来获取动物的节律参数。但是,在人体上的这种转化就非常困难。所以,研究者们便试图通过开发各种非创伤性方法(包括穿戴式设备如手环等)来获取人体生物节律参数用于生物钟医学。
最近的这几篇文章为我们提供了很好的思路和方法,在获取人体生物节律的参数方面迈出了一大步。不过,我个人认为到真正的转化还有一段距离。一是方法本身,基于小量样本出发的AI学习的准确性问题,以及对于各个民族、各个年龄阶段的适用性问题;二是生物钟本身的动态变化性,在疾病发生过程,甚至饮食时间、饮食成分、光线外界干预下的重塑问题;三是生物钟的异质性,各种组织、各种行为或生理过程的生物钟的时相是不同的。
因此,时间依赖治疗可能要结合药代动力学在靶器官的生物钟,而时间依赖的手术还需要考虑手术器官的生物钟,例如现在初步研究已经发现心脏手术的最佳时间在下午,但是我们却不清楚肝再生手术的最佳时间等等。这些还需要领域内的科研人员与临床各个科室的协同,才能真正实现生物钟层面的精准医疗。
参考文献:
[1] Zhang, R., Lahens, N.F., Ballance, H.I.,Hughes, M.E., & Hogenesch, J.B., A circadian gene expression atlas in mammals: Implications for biology and medicine. Proceedings of the National Academy of Sciences 111 (45),16219-16224 (2014).
[2] Montaigne, D. et al., Daytime variation of perioperative myocardial injury inc ardiac surgery and its prevention by Rev-Erbα antagonism: a single-centre propensity-matched cohort study and a randomised study. The Lancet 391 (10115), 59-69 (2018).
[3] Squire, T. et al., Does chrono-modulated radiotherapy improve pathological response in locally advanced rectal cancer? ChronobiologyInternational 34 (4), 492-503 (2017).
[4] Ruben, M.D. et al., A database of tissue-specific rhythmically expressed human genes has potential applications in circadian medicine. Science Translational Medicine 10 (2018) Advance online 9/12/2018.
[5] Mei, L.et al., Long-term in vivo recording of circadian rhythms in brains of freely moving mice. Proceedings of the National Academy of Sciences 115 (16), 4276-4281 (2018).
[6] Wittenbrink, N. et al., High-accuracy determination of internal circadian time from a single blood sample. The Journal of Clinical Investigation 128 (9), 3826-3839 (2018).
[7] Braun, R. et al., Universal method for robust detection of circadian state from gene expression. Proceedings of theNational Academy of Sciences (2018) Advance online 9/10/2018.
[8] Hughey, J.J., Hastie, T., & Butte, A.J., ZeitZeiger: supervised learning for high-dimensional data from an oscillatory system. Nucleic Acids Research44 (8), e80-e80 (2016).