数量性状位点分析论文_刘培发

导读:本文包含了数量性状位点分析论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:性状,数量,基因组,位点,杂种,含油量,同质性。

数量性状位点分析论文文献综述

刘培发[1](2016)在《油菜杂种产量的基因组选择研究及其数量性状位点的重分析》一文中研究指出甘蓝型油菜(Brassicaa napus)是世界上广泛种植并且十分重要的油料作物之一,如何充分利用油菜的杂种优势,高效地开展强优势杂交组合选育一直是油菜领域研究的重要方向。TN DH群体及其衍生的重构F2群体(RC-F2)是本实验室利用中国甘蓝型油菜品种Ningyou7及欧洲甘蓝型油菜品种Tapidor为亲本所构建的作图群体。本研究利用课题组多年积累的多性状多环境的表型数据及TN DH系的Illumina 60k芯片的基因型数据,开展种子产量数量性状位点的重分析。通过构建表型与基因型的不同的统计模型,评估油菜杂种产量的分子标记辅助选择与基因组选择的预测准确性,分析不同的遗传效应对油菜杂种优势及基因组选择预测准确性的影响。主要结果如下:1.对DH及RC-F2种子产量叁个环境下的数据进行分析,得到杂种产量的杂种优势大小,以及杂种产量的遗传构成。发现杂种产量具有较强的杂种优势且显性效应为杂种优势的主要遗传基础,上位性效应次之。2.比较分子标记辅助选择与基因组选择对杂种产量预测准确性的高低。发现对于杂种产量这种复杂的性状,基因组选择(GBLUP、BayesCπ)的准确性要远高于分子标记辅助选择。3.比较不同的遗传效应对杂种产量预测准确性的影响。发现在基因组选择时显性效应模型(考虑加性、显性效应)可比加性效应模型提高33%预测准确性,上位性效应模型(考虑加性、显性、上位性效应)可比显性效应模型(考虑加性与显性效应)提高9%的预测准确性。显性效应对于基因组选择准确性的提高比上位性效应有更大影响。4.对16110个潜在的杂种产量进行模拟预测,并种植验证群体进一步验证预测准确性。同时选择模拟预测中表现最佳的1%潜在杂种,其产量比现有的318个杂种高16%。基因组选择模拟预测可以检测出更多优秀的杂交组合。5.对DH群体不同的性状进行基因组选择预测分析,比较不同的性状基因组选择预测准确性的差异。研究发现不同农艺性状的基因组选择的准确性与性状的遗传力呈正相关(除了含油量)。本研究通过对分子标记辅助选择、基因组选择以及不同的遗传效应对预测准确性的分析,以期能够建立一个合理有效的基因组选择模型。其能够有效的预测油菜产量及其他复杂性状,为油菜进行基因组选择提供一定参考意义。(本文来源于《华中农业大学》期刊2016-06-01)

娄娇[2](2016)在《基于表达数量性状位点(eQTL)定位分析策略的结直肠癌遗传易感性研究》一文中研究指出研究背景结直肠癌(colorectal cancer, CRC)是当今全球第叁大恶性肿瘤,严重威胁人类的健康。2015年我国CRC新发病例37.6万例,死亡病例19.1万例,五年生存率仅为44%左右,CRC已成为我国当前亟待解决的重大公共卫生问题之一,而其发病率和死亡率居高不下的根本原因在于对其生物学病因机制缺乏突破性认识。CRC是一种由遗传因素和环境因素长期共同作用引起的复杂性疾病,其中,遗传因素决定了肿瘤的易感性。全基因组关联研究(genome-wide association study, GWAS)目前已识别出一系列与CRC发病风险相关的单核苷酸多态性(single nucleotide polymorphism, SNP)位点,但该研究不能全面揭示CRC发生发展的生物学机制,且这些位点很有可能并非真正的致病位点。因此,需要对这些易感位点进行深入挖掘,找出真正的致病位点并阐明其生物学机制。GWAS遗传易感位点约80%位于基因组非编码区,提示其中的致病位点可能对基因表达存在调控功能,而表达数量性状位点(expression quantitative trait loci, eQTL)分析可定位影响一个或多个基因表达水平的遗传变异,因此,eQTL为评估非编码区SNP的生物学机制提供了一个有效可行的策略。eQTL具有组织特异性,在肿瘤组织中进行eQTL分析时,需要考虑体细胞及表观遗传对基因表达的影响。GWAS公共数据库、DNA元件百科全书(Encyclopedia of DNA elements, ENCODE)数据库以及癌症基因组图谱(The Cancer Genome Atlas, TCGA)数据库等的建立有助于科学家们在已有成果基础上进行数据深度解析,探寻真正致病的遗传变异,对进一步阐明CRC的发生发展机制具有重要意义。研究目的1.利用TCGA数据库探索CRC GWAS遗传易感区域内的eQTL;2.分析这些eQTL与中国汉族人群CRC发生风险的关联;3.寻找这些eQTL中真正致病的遗传变异,并进行功能学研究初探。研究方法1.从TCGA数据库下载CRC相关数据集,人群分层分析后采用两次线性回归模型,在校正了体细胞拷贝数变异和甲基化对基因表达水平的影响后,评估CRCGWAS遗传易感区域内标签SNP及连锁不平衡SNP与基因表达水平的关联性,即整合的顺式和反式eQTL分析,并通过ENCODE^ Cistrome等生物信息学工具进行模块分析,找出反式eQTL中存在中间媒介——转录因子(transcription factor, TF)的遗传位点。2.整合eQTL分析所获得的SNP位点通过HaploView软件排除冗余后,采用Sequenom MassARRAY中通量基因分型平台,对北京地区768例CRC病例和768例健康对照进行基因分型检测,采用非条件logistic回归分析筛选出阳性关联SNP。3.通过RegulomeDB、rSNPBase、ANNOVAR、GWAVA等多种生物信息学预测工具,对阳性关联SNP紧密连锁区域进行综合分析,筛选出潜在功能性位点。4.对这些潜在功能性位点,使用TaqMan基因分型技术进行两阶段病例对照研究,共纳入1833例CRC病例和2758例健康对照,分析其与CRC发病风险的关联。5.对综合以上分析所获得的潜在功能性位点,利用双荧光素酶报告基因实验和凝胶迁移或电泳迁移率实验进行生物学功能探索,以确认其在遗传病因中的重要作用机制。研究结果1.TCGA数据库中254个欧洲人种CRC个体进行整合顺式eQTL分析发现54个SNP与8个受调控基因组成的58对eQTL关联(经错误发现率校正后P<0.1),其中有5个基因在肿瘤组织和正常组织中存在差异表达。反式eQTL及模块分析共发现15个SNP及相应的2个TF (MYC、ATF1)。2. Haploview软件删除冗余位点后,共有16个候选SNP纳入第一阶段中国人群关联研究。经Bonferroni校正后,共发现5个SNP(rs6983267、rs174449、rs11169524. rs4768924、rs4500718)在多个模型下与CRC发病风险存在统计学关联。分别以各自主要等位基因为参照,加性模型下的结果分别为:rs6983267,比值比(odds ratio, OR)=1.32,95%置信区间(confidence interval, CI)=1.14-1.53,P=0.0002; rs174449, OR=0.70,95% CI=0.59-0.83, P=4.25×10-5; rs11169524, OR=1.33,95% CI=1.13-1.55, P=0.0004; rs4768924, OR=0.75,95% CI=0.64-0.88,P=0.0003; rs4500718,OR=0.68,95% CI=0.57-0.81,P=2.28×10-5。3.使用多种生物信息学工具综合分析后,从rs11169524、rs4768924、rs4500718这3个阳性关联SNP紧密连锁区域各筛选出一个最具潜在功能的SNP(rs61926301,rs12424860,rs16260)。4.第一阶段北京地区人群关联分析,发现rs61926301,rs12424860与CRC发病风险的关联具有统计学意义,加性模型结果分别为:OR=1.34,95% CI=1.14-1.57, P=0.00035; OR=0.74,95% CI=0.63-0.86,P=9.82×10-5。第二阶段武汉地区人群关联分析,只有rs61926301与CRC发病风险显着相关,加性模型结果为OR=1.22, 95% CI=1.09-1.37, P=0.0006。两独立样本合并后,rs61926301 G>T遗传变异在各个模型下均与CRC发病风险升高显着相关(共显性模型:GT vs GG:OR=1.27,95% CI=1.12-1.44,P=0.0003; TT vs GG:OR=1.59,95% CI=1.29-1.96,P=1.1×10-5;显性模型:OR=1.32,95% CI=1.17-1.49,6隐性模型:OR=1.41,95% CI=1.16-1.72,P=0.0006;加性模型:OR=1.26,95% CI=1.15-1.38, P=1.0×10-6)。5.双荧光素酶报告基因实验结果显示含rs61926301 T等位基因的片段较含G等位基因的片段有更高的启动子活性(PSW480<0.0001; PHCT116=0.0224),同时凝胶迁移或电泳迁移率实验也显示含rs61926301 T等位基因的片段较含G等位基因的片段有更强的TF结合能力。研究结论1.位于ATF1基因5’非翻译区的rs61926301 G>T遗传变异与中国人群CRC发病风险增加显着相关。2. rs61926301 G>T遗传变异可能是通过提高所在区域的启动子活性,使其与相应TF的结合能力增强,导致其调控的ATF1、DIP2B等靶基因表达水平升高,继而增加了CRC的发病风险。该位点的功能为本研究首次发现,其更加深入的生物学作用机制仍有待进一步的研究探索。创新点1.本研究利用TCGA数据库中254例CRC样本的基因型、RNA测序等相关数据对CRC GWAS遗传易感位点进行深度挖掘,在节约实验成本的基础上,样本量也较以往的研究更大,eQTL分析的效能更高。2.本研究将影响肿瘤组织基因表达的体细胞遗传和表观遗传因素也考虑在内,采用整合eQTL的方法,更好地探究生殖系遗传变异对靶基因的调控作用,结果可信度更高。3.本研究通过中国人群病例对照关联研究筛选、多种生物信息学功能预测及功能学实验验证等多种方法对eQTL分析所发现的遗传位点进行深入挖掘,找到隐藏其中的真正的致病位点并进行了功能学初探。(本文来源于《华中科技大学》期刊2016-05-01)

郭家中,王小龙,仲涛,刘海峰[3](2015)在《数量性状全基因组关联分析中上位效应遗传位点检测方法研究进展》一文中研究指出数量性状的表型变异受到大量效应微小的遗传位点和诸多环境因素的共同作用,但在数量性状的遗传研究领域,关于不同遗传位点之间加性效应与上位效应相对重要性的认识却存在着分歧。近年来,伴随着全基因组关联分析在人类及家养动物数量性状研究中的发展,在全基因组关联分析的框架内进行上位效应遗传位点的检测越发受到重视。文章以遗传力失踪问题为出发点,首先综述了标记-QTL连锁分析和GWAS框架下传统上位效应遗传位点的检测方法,然后对基于表型方差同质性检验和广义线性混合模型方法的上位效应统计推断以及混杂因素的处理方法进行了总结与梳理,旨在为数量性状全基因规模上位效应的相关研究提供理论参考。(本文来源于《西北农林科技大学学报(自然科学版)》期刊2015年10期)

马蒙,朱军[4](2014)在《数量性状位点定位和全基因组关联分析的方法与软件综述(英文)》一文中研究指出基因组学研究的主要目标是剖析复杂性状和疾病的遗传结构.数量性状位点(quantitative trait locus,QTL)定位和全基因组关联分析(genome-wide association study,GWAS)已经应用于遗传育种和药物研制,分析复杂性状和复杂疾病的遗传结构.本文回顾了分析复杂性状和复杂疾病的QTL定位和GWAS的作图方法和软件.PLINK,TASSEL,SNPassoc,GenABEL和ProbABEL是流行的软件,为GWAS提供了许多有用的功能.PLINK是目前最流行的开源全基因组关联分析的工具集,它聚合了用于分析SNP数据的许多功能.TASSEL是另一种流行的软件,整合了Q+K关联分析的诸多方法.SNPassoc、GenABEL和ProbABEL是应用于关联分析的开源代码R软件包.本文对上述提及的GWAS关联分析流行软件作了简要介绍,并介绍了新研制的QTXNetwork分析软件,它可分析QTL和GWAS定位数量性状SNP(QTS)、数量性状转录子(QTT)、数量性状蛋白子(QTP)和数量性状代谢子(QTM).本文还介绍了一些常用的分析软件,例如Windows QTL Cartographer,QTL Express,Map Manager QTX,R/qtl和QTLNetwork.(本文来源于《浙江大学学报(农业与生命科学版)》期刊2014年04期)

李玉梅,向阳[5](2013)在《运用基因型统计量对数量性状位点进行关联分析(英文)》一文中研究指出随着基因分型技术的不断发展,遗传学家可以获得大量遗传标记的基因型和单体型数据,这为鉴定人类复杂疾病基因提供了前所未有的机会。当不能直接获得单体型数据时,可以使用基因型数据的统计方法来进行关联分析.使用基因型数据对疾病基因进行关联分析的统计方法可以扩充到定位数量性状位点(QTL)。本文扩充了对疾病基因进行关联分析的主成份分析统计量PCTL和熵统计量TGE到数量性状,利用选择基因型对QTL进行关联分析。计算机模拟考察了两个统计量的I型错误率.基于10个遗传性血色病(Hereditary haemochromatosis)单体型频率的计算机模拟调查了两个统计量的统计功效.结果表明两个统计量PCTL和TGE可以有效地对QTL进行关联分析.(本文来源于《数学理论与应用》期刊2013年03期)

周喜荣,玛尔孜亚,宋晓兰,王晶,拉扎提[6](2013)在《家畜数量性状位点(QTL)定位的分析方法》一文中研究指出分子遗传学的快速发展致使高密度遗传图谱的出现,高密度遗传图谱是研究数量遗传的分子基础的一种有用工具。利用遗传标记与QTL之间的连锁关系,我们能够评估QTL对数量性状的影响,与QTL紧密连锁的标记可被用来选择动物品种中的MAS,对本介绍了评估QTL效应的原理。(本文来源于《草食家畜》期刊2013年05期)

刘璐,苏玉虹,王军,赵会仁,袁志发[7](2012)在《与猪肉色相关数量性状位点的Meta分析与整合定位》一文中研究指出为提高数量性状位点(quantitative trait loci,QTL)定位的准确性及肉色性状基因型选择,收集和整理了71个肉色相关QTL相关信息,通过构建整合图谱并进行Meta分析,使用数学模型优化猪肉色相关QTL。以美国肉畜研究中心(USDA-MARC2.0)公布的猪遗传连锁图谱为参考图谱,利用71个猪肉色相关QTL构建新的整合图谱,进一步对新图谱中的QTL簇进行Meta分析,定位"真实"QTL,缩短置信区间、减少定位误差。结果表明:71个猪肉色相关QTL在SSC3、SSC4、SSC5、SSC6、SSC7、SSC8和SSC17等染色体聚合成18个QTL簇,通过Meta分析,得到18个"真实"QTL(MQTL)"。真实"QTL的图距比较原始QTL的平均图距,均有不同程度的缩短,缩短比例为21.12%~93.91%。位于SSC4的MQTL4,原平均图距为16.43cM,经优化后图距缩短为1.00cM,缩短比例达93.91%,明显提高了QTL定位的精确度。(本文来源于《中国农学通报》期刊2012年11期)

张光忠[8](2011)在《基于基因组的金针菇遗传连锁图的构建与数量性状位点(QTL)分析》一文中研究指出本研究以高巍原生质体单核化技术得到的金针菇单核菌株L11与W23为出发菌株,二者杂交获得的1123出菇后获得单核作图群体,结合本实验室李博筛选到的两株测试菌株53和77,构建了两个测交分离群体,并进行出菇实验,对一系列的性状进行了测定。以L11,W23,1123叁个菌株的DNA为模板,筛选RAPD引物,将在亲本间产生的特异性条带回收纯化、克隆、测序,最终将RAPD标记转化为稳定的SCAR标记。本研究共筛选RAPD引物923个,选择回收了239条特异性条带,成功克隆测序181条,据此设计SCAR引物93对,最终有11对SCAR引物符合要求,引物验证成功率为11.8%。将L11与W23的全基因组进行测序,并进行序列的拼接、组装,通过二者基因组序列的比对,寻找差异区域,据此设计显性的SCAR标记引物。本研究通过这种方法设计SCAR引物116对,经过对L11、1123与W23的DNA进行PCR扩增初步验证和作图群体PCR扩增后排除严重偏分离的引物,最终有51对引物符合要求,引物验证成功率达到44.0%。以本研究中获得的62个SCAR标记对作图群体进行PCR扩增,统计最终结果,结合高巍、李博获得的金针菇SCAR标记,设置LOD=3,max distance=37.2cM,用软件Mapmaker 3.0分析标记间的遗传连锁关系,有73个标记连锁,构成11个遗传连锁群,总长度为1639.9cM,连锁群长度范围:16.5cM~569.9cM,连锁群的标记数目分别为21,16,9,6,6,3,3,3,2,2,2,相邻两标记间的的平均距离为22.5cM,标记间距离较均匀。结合构建的遗传图谱,用QTL Network-2.1软件对测定的数量性状数据进行QTL定位分析,检测到两个单核菌丝在栽培料培养基上生长速度的加性效应位点,位于W23的2号和L11的4号连锁群上,贡献率分别为14.71%和14.15%。另外,还检测到一对影响以77为测试菌株构建的测交群体菌株产量的上位效应位点,加性效应贡献率为28.65%。(本文来源于《福建农林大学》期刊2011-04-01)

蒋枞璁[9](2010)在《整合分析甘蓝型油菜中控制种子含油量变异的数量性状位点》一文中研究指出甘蓝型油菜(Brassica napus L.)是世界范围内四大油料作物之一,其菜籽产油除了满足日常食用所需,也可以被加工成工业用油;随着不可再生的原油资源日益告急,提高植物油的产量和品质对国计民生有着重大的战略意义。在过去的数十年间,甘蓝型油菜的菜籽单产量得到了翻番,菜籽油的脂肪酸含量比例可以实现满足不同用途的优化,但是菜籽的含油量提升幅度较小。由于种子含油量是一个典型的数量性状,因此通过数量性状位点遗传定位(QTL mapping)的方法来发掘其调控位点、研究其变异的机理、并应用于育种改良,是切实可行的策略。之前已有许多关于甘蓝型油菜种子含油量QTL的定位研究,但是其中存在一些问题,以致这些研究结果对育种改良实践的促进效果并不明显,如,单项研究中定位得到的QTL数目非常有限、不超过20个,单个QTL对表型变异的贡献率大多不超过10%,且很多QTL只在特定遗传群体或试验条件下才被检测得到。对种子含油量这一复杂性状的育种改良,需要有更多可操作的遗传位点、获得这些位点上相对高效的等位基因,而且还需要了解这些位点上特异基因型发挥功能的适宜条件,由此才有可能使育种实践的结果与预期相符。本研究考察了一个甘蓝型油菜双单倍体(DH)遗传群体一-TN DH群体,以及由它衍生的重构F2(Reconstructed-F2)群体--TN RC-F2群体,在连续5年、设置于中国不同地域的、共计15个独立试验中的种子含油量变异。其中,该遗传群体的两亲本材料Tapidor和宁油7号均为中等含油量品系,在多个试验中的种子含油量均值分别为43.0±1.7%和41.7±2.1%,遗传群体内的变异为典型的连续分布,且呈现超亲分离,变异范围可达到从33%到51%,平均变幅为11%。另外,通过对TNDH群体各个株系的主花序自下而上进行分节段收获角果(分为5段),我们发现不同株系在沿节段发育过程中种子含油量的变异形式有所不同,相邻节段间种子含油量或表现上升或表现下降。在一定的植株极性条件下,这种不同形式的变异有可能与不同节段上角果发育期间的环境条件有关。通过对相邻节段过渡上变异形式不同的株系分组,进行基因型与变异类型的独立性测验,得到基因组上103个标记位点与不同的变异类型相关。将各个节段上的收获也作为独立试验,我们对上述共计20个独立试验分别进行了QTL定位和上位性互作对位点的检测,共得到195个、大部分存在重迭的原始QTL区间,以及92个涉及互作的标记位点。其中,105个原始QTL的显着性概率为p≤0.05,被定义为显着QTL,另90个为p≤0.5,被定义为微效QTL。涉及互作的标记位点在不同的试验间鲜有重迭,其中大部分包含在原始QTL区间以内,只有36个互作位点独立在原始QTL区间之外。而上述与节段上种子含油量变异类型相关的遗传位点中,也有一半包含在这些原始QTL区间内。根据“元分析(meta-analysis)"的方法,我们将重迭的原始QTL进行了区间的整合与精炼。由此,195个原始QTL区间被归纳为59个独立的、不相重迭的“元QTL(meta-QTL)",和28个微效、独立的原始QTL;根据这些元QTL所包含的原始QTL的显着性概率,可将它们划分为50个显着元QTL(即包含的原始QTL至少有一个为显着QTL),和9个微效真实元QTL(即包含多个重迭的微效QTL)。由于每个独立QTL包含的若干原始QTL都对应若干特定的试验,而我们记录了各个独立试验中种子油份积累关键时期的光照、温度条件,因此,可以分析这些独立QTL的环境特异性。结果发现,有28个元QTL表现出一定的环境特异性,且其中一些只在特定试验中被检测得到的独立QTL的确是对应环境条件相对极端的试验。所以我们提出,不应该忽视那些环境特异性的QTL。借助遗传图谱间的共同分子标记,我们实现了将之前报道过的其它几个具有代表性的甘蓝型油菜遗传群体中种子含油量QTL的定位结果部分映射到了TN遗传图谱上。通过比较分析发现,多环境试验有助于提高TN遗传群体中的QTL检出率,使其一个群体中所得的QTL可以覆盖其它叁个群体所得QTL的80%;另一方面,其它群体定位的QTL也验证了TN群体中30%的QTL,其中包括25%的微效QTL,另外还有近20%独立于QTL区间之外的互作位点。除了不同遗传群体间的QTL比较,我们还将由育种品系中关联分析所得的含油量变异关联位点对应到TN遗传图谱上,与定位的QTL进行了比较。关联位点验证了TN群体中约25%的QTL,其中一半为微效QTL,另外也还有近20%独立于QTL区间之外的互作位点被关联分析验证。同时,QTL效应大小也在比较分析中表现出与遗传背景或环境条件有关的明显的相对性特点。本研究中所揭示的大量QTL将为育种改良提供丰富的目标位点,而所反映出来的QTL效应大小的相对性以及遗传背景或环境条件的特异性,将对特定的遗传改良设计中对于相关遗传位点上等位基因的选择与组合提供重要的参考。(本文来源于《华中农业大学》期刊2010-12-01)

齐靖,董祯,申连英,毛永民,李艳辉[10](2009)在《枣针刺长度的数量性状位点定位与分析》一文中研究指出以150株‘冬枣’ב临猗梨枣’F1代群体为试材,调查了4种类型枣针刺(中心干上长针刺、中心干上短针刺、二次枝上长针刺和二次枝上短针刺)长度的分离情况。结果表明,4种性状表现为连续分布,具有数量性状的典型特征,且4个性状两两之间存在极显着正相关关系,在F1代群体中趋向于同步分离。使用分子连锁图谱进行数量性状位点(QTL)分析,共检测到控制枣针刺长度的QTL26个,包含控制中心干上长针刺长度10个,控制中心干上短针刺长度5个,控制二次枝上长针刺长度8个和控制二次枝上短针刺长度3个。各QTL的LOD值在2.53~5.27之间,可解释8.2%~44.2%的表型变异。26个QTL分布在分子连锁图谱的7个连锁群中,其中4个连锁群上的5个位点同时定位了2~3个类型的QTL,证实部分基因在对不同类型针刺长度的控制上存在一因多效。(本文来源于《园艺学报》期刊2009年06期)

数量性状位点分析论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

研究背景结直肠癌(colorectal cancer, CRC)是当今全球第叁大恶性肿瘤,严重威胁人类的健康。2015年我国CRC新发病例37.6万例,死亡病例19.1万例,五年生存率仅为44%左右,CRC已成为我国当前亟待解决的重大公共卫生问题之一,而其发病率和死亡率居高不下的根本原因在于对其生物学病因机制缺乏突破性认识。CRC是一种由遗传因素和环境因素长期共同作用引起的复杂性疾病,其中,遗传因素决定了肿瘤的易感性。全基因组关联研究(genome-wide association study, GWAS)目前已识别出一系列与CRC发病风险相关的单核苷酸多态性(single nucleotide polymorphism, SNP)位点,但该研究不能全面揭示CRC发生发展的生物学机制,且这些位点很有可能并非真正的致病位点。因此,需要对这些易感位点进行深入挖掘,找出真正的致病位点并阐明其生物学机制。GWAS遗传易感位点约80%位于基因组非编码区,提示其中的致病位点可能对基因表达存在调控功能,而表达数量性状位点(expression quantitative trait loci, eQTL)分析可定位影响一个或多个基因表达水平的遗传变异,因此,eQTL为评估非编码区SNP的生物学机制提供了一个有效可行的策略。eQTL具有组织特异性,在肿瘤组织中进行eQTL分析时,需要考虑体细胞及表观遗传对基因表达的影响。GWAS公共数据库、DNA元件百科全书(Encyclopedia of DNA elements, ENCODE)数据库以及癌症基因组图谱(The Cancer Genome Atlas, TCGA)数据库等的建立有助于科学家们在已有成果基础上进行数据深度解析,探寻真正致病的遗传变异,对进一步阐明CRC的发生发展机制具有重要意义。研究目的1.利用TCGA数据库探索CRC GWAS遗传易感区域内的eQTL;2.分析这些eQTL与中国汉族人群CRC发生风险的关联;3.寻找这些eQTL中真正致病的遗传变异,并进行功能学研究初探。研究方法1.从TCGA数据库下载CRC相关数据集,人群分层分析后采用两次线性回归模型,在校正了体细胞拷贝数变异和甲基化对基因表达水平的影响后,评估CRCGWAS遗传易感区域内标签SNP及连锁不平衡SNP与基因表达水平的关联性,即整合的顺式和反式eQTL分析,并通过ENCODE^ Cistrome等生物信息学工具进行模块分析,找出反式eQTL中存在中间媒介——转录因子(transcription factor, TF)的遗传位点。2.整合eQTL分析所获得的SNP位点通过HaploView软件排除冗余后,采用Sequenom MassARRAY中通量基因分型平台,对北京地区768例CRC病例和768例健康对照进行基因分型检测,采用非条件logistic回归分析筛选出阳性关联SNP。3.通过RegulomeDB、rSNPBase、ANNOVAR、GWAVA等多种生物信息学预测工具,对阳性关联SNP紧密连锁区域进行综合分析,筛选出潜在功能性位点。4.对这些潜在功能性位点,使用TaqMan基因分型技术进行两阶段病例对照研究,共纳入1833例CRC病例和2758例健康对照,分析其与CRC发病风险的关联。5.对综合以上分析所获得的潜在功能性位点,利用双荧光素酶报告基因实验和凝胶迁移或电泳迁移率实验进行生物学功能探索,以确认其在遗传病因中的重要作用机制。研究结果1.TCGA数据库中254个欧洲人种CRC个体进行整合顺式eQTL分析发现54个SNP与8个受调控基因组成的58对eQTL关联(经错误发现率校正后P<0.1),其中有5个基因在肿瘤组织和正常组织中存在差异表达。反式eQTL及模块分析共发现15个SNP及相应的2个TF (MYC、ATF1)。2. Haploview软件删除冗余位点后,共有16个候选SNP纳入第一阶段中国人群关联研究。经Bonferroni校正后,共发现5个SNP(rs6983267、rs174449、rs11169524. rs4768924、rs4500718)在多个模型下与CRC发病风险存在统计学关联。分别以各自主要等位基因为参照,加性模型下的结果分别为:rs6983267,比值比(odds ratio, OR)=1.32,95%置信区间(confidence interval, CI)=1.14-1.53,P=0.0002; rs174449, OR=0.70,95% CI=0.59-0.83, P=4.25×10-5; rs11169524, OR=1.33,95% CI=1.13-1.55, P=0.0004; rs4768924, OR=0.75,95% CI=0.64-0.88,P=0.0003; rs4500718,OR=0.68,95% CI=0.57-0.81,P=2.28×10-5。3.使用多种生物信息学工具综合分析后,从rs11169524、rs4768924、rs4500718这3个阳性关联SNP紧密连锁区域各筛选出一个最具潜在功能的SNP(rs61926301,rs12424860,rs16260)。4.第一阶段北京地区人群关联分析,发现rs61926301,rs12424860与CRC发病风险的关联具有统计学意义,加性模型结果分别为:OR=1.34,95% CI=1.14-1.57, P=0.00035; OR=0.74,95% CI=0.63-0.86,P=9.82×10-5。第二阶段武汉地区人群关联分析,只有rs61926301与CRC发病风险显着相关,加性模型结果为OR=1.22, 95% CI=1.09-1.37, P=0.0006。两独立样本合并后,rs61926301 G>T遗传变异在各个模型下均与CRC发病风险升高显着相关(共显性模型:GT vs GG:OR=1.27,95% CI=1.12-1.44,P=0.0003; TT vs GG:OR=1.59,95% CI=1.29-1.96,P=1.1×10-5;显性模型:OR=1.32,95% CI=1.17-1.49,6隐性模型:OR=1.41,95% CI=1.16-1.72,P=0.0006;加性模型:OR=1.26,95% CI=1.15-1.38, P=1.0×10-6)。5.双荧光素酶报告基因实验结果显示含rs61926301 T等位基因的片段较含G等位基因的片段有更高的启动子活性(PSW480<0.0001; PHCT116=0.0224),同时凝胶迁移或电泳迁移率实验也显示含rs61926301 T等位基因的片段较含G等位基因的片段有更强的TF结合能力。研究结论1.位于ATF1基因5’非翻译区的rs61926301 G>T遗传变异与中国人群CRC发病风险增加显着相关。2. rs61926301 G>T遗传变异可能是通过提高所在区域的启动子活性,使其与相应TF的结合能力增强,导致其调控的ATF1、DIP2B等靶基因表达水平升高,继而增加了CRC的发病风险。该位点的功能为本研究首次发现,其更加深入的生物学作用机制仍有待进一步的研究探索。创新点1.本研究利用TCGA数据库中254例CRC样本的基因型、RNA测序等相关数据对CRC GWAS遗传易感位点进行深度挖掘,在节约实验成本的基础上,样本量也较以往的研究更大,eQTL分析的效能更高。2.本研究将影响肿瘤组织基因表达的体细胞遗传和表观遗传因素也考虑在内,采用整合eQTL的方法,更好地探究生殖系遗传变异对靶基因的调控作用,结果可信度更高。3.本研究通过中国人群病例对照关联研究筛选、多种生物信息学功能预测及功能学实验验证等多种方法对eQTL分析所发现的遗传位点进行深入挖掘,找到隐藏其中的真正的致病位点并进行了功能学初探。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数量性状位点分析论文参考文献

[1].刘培发.油菜杂种产量的基因组选择研究及其数量性状位点的重分析[D].华中农业大学.2016

[2].娄娇.基于表达数量性状位点(eQTL)定位分析策略的结直肠癌遗传易感性研究[D].华中科技大学.2016

[3].郭家中,王小龙,仲涛,刘海峰.数量性状全基因组关联分析中上位效应遗传位点检测方法研究进展[J].西北农林科技大学学报(自然科学版).2015

[4].马蒙,朱军.数量性状位点定位和全基因组关联分析的方法与软件综述(英文)[J].浙江大学学报(农业与生命科学版).2014

[5].李玉梅,向阳.运用基因型统计量对数量性状位点进行关联分析(英文)[J].数学理论与应用.2013

[6].周喜荣,玛尔孜亚,宋晓兰,王晶,拉扎提.家畜数量性状位点(QTL)定位的分析方法[J].草食家畜.2013

[7].刘璐,苏玉虹,王军,赵会仁,袁志发.与猪肉色相关数量性状位点的Meta分析与整合定位[J].中国农学通报.2012

[8].张光忠.基于基因组的金针菇遗传连锁图的构建与数量性状位点(QTL)分析[D].福建农林大学.2011

[9].蒋枞璁.整合分析甘蓝型油菜中控制种子含油量变异的数量性状位点[D].华中农业大学.2010

[10].齐靖,董祯,申连英,毛永民,李艳辉.枣针刺长度的数量性状位点定位与分析[J].园艺学报.2009

论文知识图

肾近端小管尿酸转运Fig.1Uricacidtrans...2.2研究的技术略线1 SG5 扩增结果初定位结果与鸡CNV有关的表型(a)豆冠;(b)蝴...滑叶蔺8个引物ISSR-PCR反

标签:;  ;  ;  ;  ;  ;  ;  

数量性状位点分析论文_刘培发
下载Doc文档

猜你喜欢