论文摘要
非编码RNA(noncoding RNA,ncRNA),即转录,但不翻译成蛋白质的RNA。随着高通量测序技术的发展,数十万条非编码RNA已被鉴定和注释,并发现作为生物学功能的重要调控因子广泛的存在于哺乳动物和其他物种体内。对于这些非编码RNA的功能和机制研究,是当前生物领域的前沿和热点之一。在已有的非编码RNA功能研究工作中,许多非编码RNA被发现通过结合在染色质来调控基因的转录,如XIST,HOTAIR,MALAT1等。这种方式目前被认为是非编码RNA,尤其是长链非编码RNA(lncRNA)行使功能的主要方式之一。长链非编码RNA既可以通过招募染色质修饰蛋白来调节染色质状态,也可以通过连接基因启动子区域和远端增强子区域直接调控基因转录。另一方面,由于仍有90%以上的非编码RNA功能尚未被研究,领域内也致力于发展全基因组水平的非编码RNA功能筛选技术,如利用CRISPR为基础的CRISPRi-screen技术,来筛选在细胞增殖中发挥功能的lncRNA。尽管如此,目前依然十分缺乏对非编码RNA和染色质结合的系统性研究。在此背景下,我们开发了名为 PIRCh-seq(Profiling Interacting RNAs on Chromatin)的测序技术。该技术可利用不同组蛋白抗体或组蛋白修饰抗体,如H3、H3K4me3、H3K27ac等,富集结合在对应区域上的非编码RNA,之后利用高通量测序技术,实现在组蛋白修饰这一表观基因组水平,定性并定量的分析和染色质结合的非编码RNA。利用PIRCh-seq,我们一方面可以筛选到细胞内和染色质,尤其是不同修饰状态下的染色质结合的非编码RNA,系统性的描述非编码RNA和染色质的结合特征,另一方面通过开发新的生物信息学算法和模型,深入研究和染色质结合的非编码RNA的功能及其对基因转录调控的作用机制。我们分别在人和小鼠共5种细胞系上(HFF,H9,mESC,MEF和NPC),获得了 7种不同的组蛋白及组蛋白修饰(H3,H3K4me1,H3K4me3,H3K9me3,H3K27me3,H3K27ac,和H4K16ac)抗体的PIRCh-seq结果。通过对比不用抗体的Input对照组,我们发现PIRCh-seq能准确的捕获到和染色质结合非编码RNA,并且不同组蛋白修饰的染色质会明显富集不同的非编码RNA,例如XST作为一个沉默X染色体基因表达的最重要的非编码RNA,只检测到在H3K27me3修饰的组蛋白上富集。通过对比之前已发表的染色质结合非编码RNA检测技术,我们发现PIRCh-seq在去除初生转录本这一主要噪音信号的效果,显著优于其他方法,并且该效果在不同组蛋白修饰抗体上表现稳定。进一步的分析结果显示,相比于mRNA,非编码RNA在整体上更具有染色质结合偏好性,其中长链非编码RNA占主要比例(90%以上)。在小鼠胚胎干细胞V6.5中,我们通过一系列生物信息分析,最终筛选获得了 258个染色质结合非编码RNA,其中绝大部分非编码RNA的功能是未曾被研究过的。为了研究相关非编码RNA和染色质的结合模式及其功能,我们对数据进行了降维展示和无监督聚类。结果显示存在6种非编码RNA和染色质的结合模式,分别对应于不同的染色质状态,如H3K4me1和H3K27ac代表的启动子,H3K4me3和H3K27ac代表的增强子,H3K27me3代表的转录抑制区域等。该结果说明染色质结合非编码RNA可能是通过结合到不同状态下染色质区域,发挥不同的调控功能。进一步比较染色质结合非编码RNA临近基因的表达水平,我们可以观察到临近编码基因转录水平和非编码RNA和染色质的结合状态成正相关,说明大多数非编码RNA都顺式调控其周围编码基因的表达。通过整合分析小鼠不同细胞系的PIRCh-seq结果,我们发现染色质结合非编码RNA同样具有细胞种类特异性,只有为数不多的非编码RNA在多个细胞系的染色质中均有富集。有趣的是,我们发现有部分非编码RNA,如ub008bcq.1,在胚胎干细胞中会同时富集在染色质活跃和抑制区域,说明它们在干细胞中可能具有增强和抑制基因表达的双重功能,而在终末分化的细胞系中,这些非编码RNA却只富集在染色质活跃或者抑制区域,说明它们在分化后的细胞中可能只具备增强或者抑制基因表达的单重功能。为了进一步探究非编码RNA和染色质结合的机制,我们整合已发表的RNA二级结构icSHAPE数据和RNA m6A甲基化修饰数据,发现非编码RNA和染色质的结合位点更倾向于单链结构,并且RNA上的突变位点产生的RNA结构变化都会影响其和染色质的结合能力。最后,为了进一步证实PIRCh-seq所发现的染色质结合非编码RNA的确具有潜在的生物学功能,我们挑选小鼠神经前体细胞中所筛选到的一个结合在H3K4me3上的非编码RNA lnc-Nr2f1。我们对lnc-Nr2f1进行ChIRP-seq实验,鉴定其在全基因组水平上染色质的结合位点。结合组蛋白修饰ChIP-seq实验结果显示lnc-Nr2f1确实主要结合H3K4me3修饰区域,这与我们PIRCh-seq结果高度一致。同时对ChIRP-seq发现的lnc-Nr2f1结合基因功能分析,我们发现lnc-Nr2f1具有调控神经细胞发育的能力。综上所述,本研究工作开发的PIRCh-seq技术可以有效的富集不同组蛋白修饰状态下的染色质结合的非编码RNA。该技术对系统性的揭示非编码RNA和染色质的互作机理有重要的科学意义,并为进一步研究非编码RNA对基因转录的调控机制提供了新的方法和手段,将有可能在非编码RNA研究领域有广泛的应用前景。
论文目录
文章来源
类型: 博士论文
作者: 方靖文
导师: 瞿昆
关键词: 非编码,表观遗传,组蛋白修饰,高通量测序
来源: 中国科学技术大学
年度: 2019
分类: 基础科学
专业: 生物学,生物学
单位: 中国科学技术大学
分类号: Q75
DOI: 10.27517/d.cnki.gzkju.2019.000232
总页数: 96
文件大小: 7181K
下载量: 80