生化教科书将剪接体形容为细胞里最复杂的超大分子复合物。剪接体结构解析的难度普遍认为高于RNA聚合酶和核糖体,后两者的结构解析曾分别获得2006年和2009年的诺贝尔化学奖。
我们都知道,包括人类在内的每一种生物的生命活动,包括行为、语言、认知等等,都是由基因所编码的。那么基因是如何控制生物体的生命过程呢?那就不得不提DNA了。众所周知,DNA是遗传物质。但是DNA本身没有办法直接控制细胞活动,它需要将自身携带的遗传信息经过RNA转化到蛋白质,后者直接执行生命活动。如果很难理解,不妨把DNA想象成我们的大脑,本身并不能跑不能跳,大脑(DNA)需要通过神经系统(RNA)来控制肌肉等组织器官(蛋白质)让我们能吃能动。遗传信息从存储的DNA转化为具有各种结构、执行各种功能的蛋白质的过程,就叫做中心法则。
中心法则其实是一个遗传信息传递的过程。在真核细胞中,该过程共分为三步,分别由RNA聚合酶、剪接体和核糖体执行。首先,以DNA为模板,在RNA聚合酶的催化作用下合成前体信使RNA (简称pre-mRNA),DNA中的遗传信息于是传递到了pre-mRNA,这一步叫做转录;事实上,真核细胞DNA中遗传信息不是连贯的,是被很多被称为内含子的序列打乱顺序的,遗传信息实际分布在被称为外显子的片段上,而通过转录,这样的非常粗糙的“乱序”信息也跟着被传递到了pre-mRNA,等待着被筛选破译,这个过程就需要剪接体大显神威。精确地剪掉内含子、连接外显子,生成携带有连贯信息的成熟信使RNA,这一步就叫做剪接;随后,成熟的信使RNA将作为模板,在核糖体的催化作用下合成蛋白质。丰富多彩的蛋白质执行支撑起细胞活动的各种功能。关于第一步的转录和第三步的核糖体翻译,科学家们已经在原子、分子层面上“看清楚”它们是如何进行的了,但是中间这一步的剪接究竟是如何完成,在2015年之前,科学家们主要通过遗传和生化研究获得相关线索和证据,去推测去猜想,但在结构和分子机理上的认知并不清楚。
RNA剪接示意图(图源:Yan, C., Wan, R., & Shi, Y. (2019). Cold Spring Harbor perspectives in biology, 11(1), a032409.)
通俗来讲就是:pre-mRNA这盒通过转录形成的“磁带”中间夹杂着很多“噪音”,在播放的时候,有时候有声音,有时候没声音……如果我们将没有携带基因信息的内含子比作没声音的部分,那么在播放的时候,声音就会时断时续,基因的信息传递也就时断时续。这时就需要一位能工巧匠,把磁带中没有声音的部分(内含子)剪掉,再把有声音的部分(外显子)按照特定的顺序连接起来。值得一提的是,外显子们甚至不是1、2、3 的串联,可能需要1、3、2或者2、1、3等不同顺序的组合;这样一条pre-mRNA就可能翻译出不同的信息,也就是变成不同的成熟信使RNA,合成不同的蛋白质。到底内含子和外显子的分界线在哪里、外显子又要通过什么方式连接,这都需要具备火眼金睛的能工巧匠,这位能工巧匠便是剪接体了。每个细胞对于每一条前体信使RNA的剪接在时空上是非常精准的。剪掉谁,剪掉多长,什么时候剪,按照什么顺序把外显子拼接起来,每一个“操作”都是可能改变细胞命运的关键问题。一步走错,结果千差万别,基因的表达和传递也会因此出现错误,于是就导致了人类某些先天遗传疾病以及后天疑难杂症的出现。研究发现,人类的遗传疾病大约有35%都是因为剪接异常造成的。因此,剪接体的研究对人类健康至关重要,自1993年RNA剪接的发现被授予诺贝尔生理及医学奖以来,科学家们一直在探索其中的分子奥秘,期待早日揭示这个复杂过程的分子机理,然而始终未能取得巨大突破。这是由于剪接体作为一个巨大而又复杂的动态分子机器,即便在倍数很高的电子显微镜下也难以清晰地观详其一二,因此,生化教科书将剪接体形容为细胞里最复杂的超大分子复合物。剪接体结构解析的难度普遍认为高于RNA聚合酶和核糖体,后两者的结构解析曾分别获得2006年和2009年的诺贝尔化学奖,被称为世界结构生物学公认的两大难题之一。所以,解析剪接体这颗分子生物学皇冠上的明珠,曾经成为很多生物学家的终极梦想。经过7年的努力,施一公团队终于在2015年首次解析了裂殖酵母剪接体3.6埃的高分辨率结构,(1埃,即1纳米的十分之一;百亿分之一米),首次展示了剪接体催化中心近原子分辨率的结构。这一重大研究成果对RNA剪接机理的研究产生革命性影响。美国加州大学圣地亚哥分校细胞与分子医学系教授付向东表示,通过对剪接体近原子分辨率结构的解析,解决了该领域的核心问题,是RNA剪接领域里程碑式的重大突破,也是近30年中国在基础生命科学领域对世界科学的最大贡献。自2015年第一个剪接体结构发表以后,施一公研究组相继解析了酿酒酵母剪接体复合物处于8个不同状态的高分辨率结构,这些已解析的剪接体基本覆盖了整个RNA剪接循环,从分子层面揭示了剪接体催化RNA剪接两步反应的工作机理,同时为理解剪接体的组装、激活和解聚等过程的发生提供了结构依据。2019年3月,最难捕获的,对于理解第一步剪接反应的发生具有至关重要的作用的B* complex的4个不同构象的高分辨率三维结构也终于被解析。该结构首次揭示了第一步剪接反应发生过程中的动态变化,展现了剪接因子对于剪接反应发生的重要作用,第一次从结构信息中回答了剪接体对不同pre-mRNA底物识别的特异性等重要科学问题。至此,施一公研究组成为世界上首个、也是唯一一个成功捕获并解析了RNA剪接过程中所有完全组装剪接体高分辨率三维结构系列成果的团队。
施一公研究组解析的酵母剪接体结构汇总(图源:https://ygshi.org/research)
迄今,施一公研究组在酵母中一共解析了10个不同状态的剪接体高分辨的三维结构,从组装到被激活,从两步转酯反应发生到剪接体的解聚,这10个状态的剪接体完整覆盖了剪接通路,首次将剪接体介导的RNA剪接过程完整的串联起来,为理解RNA剪接的分子机理提供了最清晰、最全面的结构信息。本期视频展现的便是pre-mRNA剪接循环这一过程。十年磨一剑,10个不同状态的剪接体高分辨的三维结构都已被解析,是不是意味着剪接体的研究可以告一段落了?是不是意味着可以投入临床应用了?当然不是!研究的道路还很漫长。比如,与疾病有关的剪接体突变体的结构是怎样的,它们是如何变的异常的,又是如何导致疾病的,剪接体的调控机理是怎样的,它们在细胞内部的动态组合和变化是怎样的?等等。这些都是尚需解决的问题。从基础科学的研究到临床应用,再到治疗疾病,还有一段漫长的距离。但是,基础研究的每一项突破都让我们在宇宙中,在地球上,将我们人类的已知边界向外拓展了一步,都让人类在未知世界的探索中往前迈进了一步。参考资料
[1] https://www.cell.com/cell/fulltext/S0092-8674(19)30155-2
[2] http://science.sciencemag.org/content/early/2018/05/23/science.aau0325
[3] http://science.sciencemag.org/content/early/2018/01/03/science.aar6401
[4] http://www.cell.com/cell/fulltext/S0092-8674(17)31264-3
[5] http://www.cell.com/cell/fulltext/S0092-8674(17)30954-6
[6] https://doi.org/10.1016/j.cell.2017.04.033
[7] http://science.sciencemag.org/content/early/2016/12/14/science.aak9979.full
[8] http://science.sciencemag.org/content/early/2016/07/20/science.aag0291
[9] http://science.sciencemag.org/content/early/2016/07/20/science.aag2235
[10] http://science.sciencemag.org/content/early/2016/01/06/science.aad6466
[11] http://science.sciencemag.org/content/early/2015/08/19/science.aac8159
[12] http://science.sciencemag.org/content/early/2015/08/19/science.aac7629