内含子滞留(Intron Retention)研究的生物学意义
1、IR是可变剪接的一种形式
可变剪接是真核细胞调控基因功能的一种重要方式(De Conti et al., 2013)。人类约有92% - 94%基因包含可变剪接的形式(Chen and Manley, 2009; Wang et al., 2008)。可变剪接可以使同一个基因生成功能特异的蛋白分子,这些蛋白分子又涉及到多种生物学过程,包括细胞生长、分化和死亡等(Chen and Manley, 2009)。
伴随着分子克隆技术以及高通量测序技术的发展,可变剪接的调控机制被进一步揭示(Broseus and Ritchie, 2020)。目前,可变剪接主要包含外显子遗漏与外显子增加、5’和3’的可变区剪切、内含子滞留等形式(Ramanouskaya and Grinev, 2017)。
其中,IR是近几年备受关注的一种剪接形式,越来越多的研究显示IR的产生是一种复杂且受到精确调控的过程。它被认为是外界多种压力下,基因转录后调控的一种潜在机制(Jacob and Smith, 2017; Wong and Schmitz, 2022)。
因此,深入挖掘IR的产生机制不仅有助于加深对mRNA可变剪接的了解,也能进一步揭示基因的转录后调控过程。
2、IR具有复杂的生物学功能
IR的存在非常广泛,并且影响约80%的可编码基因,这些特异的剪接有着多种生物学功能(Braunschweig et al., 2014)。
——引自Braunschweig, U., et al., Genome Research , Widespread intron retention in mammals functionally tunestranscriptomes.
在血细胞形成过程中,IR可以调节mRNA的表达模式。Wong等发现在粒细胞形成过程中, IR影响了86个基因的表达,并且这些IR与剪接因子表达水平的降低密切相关。另外,他们还发现IR可以诱发无意义介导的衰变过程,最终降低蛋白表达水平(Wong et al., 2013)。
——引自Wong, J. J. et al., Cell , Orchestrated intron retention regulates normal granulocyte differentiation.
IR还与神经元的活性密切相关。在小鼠的新皮层细胞核中存在大量IR的转录本,当神经元被激活后,部分转录本的内含子部分被切除,随后新的转录本被运送出核外并与核糖体结合翻译成蛋白(Mauger et al., 2016)。
——引自Mauger, O. et al., Neuron , Targeted Intron Retention and Excision for Rapid Gene Regulation in Response to Neuronal Activity.
IR还普遍存在于肿瘤细胞中,是其转录组多样性的主要来源之一。Dvinge和Bradley研究并分析了16种肿瘤类群,发现了大量不正常的RNA剪接,其中IR最具有代表性,极大的丰富了转录组的多样性(Dvinge and Bradley, 2015)。
——引自Dvinge, H. & Bradley, R. K., Genome Medicine , Widespread intron retention diversifies most cancer transcriptomes.
此外也有文献提到了IR在生殖细胞的分化以及CD4+T细胞的激活过程中发挥的重要作用(Naro et al., 2017; Ni et al., 2016),充分说明了IR功能的多样性。
3、IR研究的新领域与新挑战
近年来在高通量测序技术的辅助下,大量包含IR的mRNA被发现。Adusumalli等研究发现果蝇头部、小鼠和人类脑部组织在衰老过程中IR的水平是不断升高的,并且在衰老样本中受影响而产生IR的基因与阿尔兹海默症发病通路有关(Adusumalli et al., 2019)。
——引自Adusumalli, S. et al., Aging Cell , Increased intron retention is a post-transcriptional signature associated with progressive aging and Alzheimer's disease.
然而,IR的价值不仅仅体现在RNA水平。到目前为止,已经有多项研究表明IR可以被翻译成新的多肽,并且这些新的多肽能够行使新的功能。Jonghe等在阿尔兹海默症患者体内发现了presenilin-1基因的异常剪接,这导致了第四个内含子的3个核苷酸发生滞留,形成了新的转录本,并且可以翻译成蛋白。新的presenilin-1能够显著增加Aβ42的表达,同时Aβ42/ Aβ40的比例也大幅提高,提示了这种IR形式的presenilin-1可能促进阿尔兹海默症的表型(De Jonghe et al., 1999)。
——引自De Jonghe, C., et al., Human molecular genetics , Aberrant splicing in the presenilin-1 intron 4 mutation causes presenile Alzheimer's disease by increased Abeta42 secretion.
除此之外,可编码的IR也能够提供新的抗原表位或者作为潜在的治疗靶点。微管结合蛋白Tau是细胞内重要的蛋白分子,它的异常表达导致包括阿尔兹海默症在内的多种疾病。Tau存在多种形式的可变剪接,García‑Escudero等发现了Tau的一种IR形式。Tau的异常剪接导致第12个内含子的57个核苷酸发生滞留,形成截短形式的mRNA。由于含有终止密码子,因此编码出的截短蛋白的C末端含有18个新的氨基酸。García‑Escudero等利用这些新编码的氨基酸作为抗原生产出特异性抗体,并发现与野生型蛋白相比,新蛋白具有相似的翻译后修饰过程以及微管结合能力。但是,病人脑组织中新蛋白的表达是降低的,提示了该蛋白的正向保护作用(Garcia-Escudero et al., 2021)。
——引自Garcia-Escudero, V., et al., Acta neuropathologica , A new non-aggregative splicing isoform of human Tau is decreased in Alzheimer's disease.
综上所述,可编码出新多肽的IR具有潜在的研究价值,它不仅能够提供特异性的标志分子,也可以为靶向药物提供研究方向。但是,如何在丰富的IR转录库中筛选出可编码的IR也是一种新的挑战,值得后续更多的研究与发现。