单体型分析论文_周银生

导读:本文包含了单体型分析论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:体型,多态性,遗传病,基因,基因组,遗传学,目标。

单体型分析论文文献综述

周银生[1](2019)在《单体型分析的算法研究》一文中研究指出单体型是染色单体上一组紧密连锁的位点,通常会共同遗传给后代,可以视作多个位点组成的“超级等位基因”。单体型信息在全基因组关联分析,连锁分析,遗传表现,流行病学,群体遗传学中都有重要的作用。大部分生物,包括人类都是二倍体,常规的新一代测序技术只能获得两条单体型复合得到的基因型序列信息,而每条染色体上各自的序列信息(又称为相型信息)无法被直接观测。此外,将来自不同个体DNA混合测序的混合基因池设计方法,由于具有成本低廉等优点,也被广泛应用在全基因组关联分析(GWAS)的第一阶段中。因此,如何从不完全的基因型数据,或是混合基因型数据中,重建个体的相型信息,推断出群体中真实存在的单体型以及估计对应的频率,是基因组学研究中的基础问题,已经得到了广泛关注。本文梳理了文献中单体型分析的主要算法框架发展历史,并且提出了基于压缩感知的单体型频率估计算法CSHAP以及用于分型的基于近似溯祖先验的广义EM算法(GEM)。大量模拟研究表明,CSHAP算法在单体型频率估计问题上有优秀的表现和极高的计算效率。我们的算法支持个体设计和混合设计,并且无论当哈代-温伯格平衡定律成立与否均可以给出稳健估计。从模拟试验的表现上看,CSHAP的精度和目前公认的最精确的PHASE算法近似,小样本下的精度甚至比PHASE更好。而在大样本下,CSHAP的计算速度要比PHASE快2~3个数量级,并且时间消耗相对样本量仅呈现对数级增长,可以高效地应用于大规模数据集上。对于混合基因池设计,CSHAP的计算复杂度与池的容量无关,可以支持处理任意大容量下的混合DNA设计,同时允许的最大位点数也远超于文献中现有的最好算法。测序实验中,由于实验仪器原因,往往存在缺失位点,缺失数据会对下游研究造成很大影响。因此如何将缺失基因数据补全成为完整数据,是基因组研究中至关重要的问题。文献中已有很多基因补全的方法,包括纯统计的,基于连锁不平衡的或是基于参考单体型的算法。我们比较了不同基因补全算法的精度,并且将EM算法和CSHAP算法扩展到缺失数据补全上。模拟实验表明,使用单体型信息补全的算法精度要高于基于连锁不平衡的。由于压缩感知对于缺失的稳健性,CSHAP算法可以提供相当高的补全精度。同时,CSHAP的频率估计精度受缺失率的影响很小(相对于其它算法),即使缺失率较高情况下也可以给出稳健的估计。一直以来,基于EM的推断算法被认为具有较高的频率估计精度,但是单体分型精度较差。这是因为频率估计和单体分型问题的目标不同,频率估计要求估计的单体型与真实存在的单体型精确相同,但单体分型更加需要考虑分型结果和真实双体型的相似性。我们分析了EM分型精度差的原因,并且采用其它框架下的知识作为先验,提出了广义EM算法(GEM)。模拟研究表明,GEM的分型精度要远高于常规的EM算法,和主流分型软件fastPHASE接近,但是GEM的运行效率要比PHASE,Shape-IT等均高出数个数量级。最后,利用进一步的HMM改进,GEM可以支持任意长序列的分型问题。(本文来源于《中国科学技术大学》期刊2019-05-01)

王江,朱家红,刘东云,熊顺,韩伟[2](2019)在《SNP单体型分析在单基因遗传病PGD中的应用》一文中研究指出目的探讨单核苷酸多态性(SNP)单体型分析在单基因遗传病植入前遗传学诊断(PGD)中的临床应用价值。方法活检囊胚滋养层细胞全基因组扩增产物,应用SNP单体型分析方法进行诊断,并用Sanger测序进行验证。结果共205枚胚胎同时完成了SNP单体型分析和Sanger测序验证,155枚胚胎(75.61%)诊断结果一致,18枚胚胎(8.78%)诊断结果不一致。Sanger测序失败有30枚胚胎(14.63%),单体型分析有2枚胚胎(0.98%)失败,后者诊断失败率明显低于前者(P<0.05)。41个移植周期共45枚胚胎移植,临床妊娠率为70.73%(29/41),种植率为71.11%(32/45)。胎儿中孕期羊水产前诊断结果与胚胎单体型分析诊断结果一致。结论 SNP单体型分析准确性好,与Sanger测序相比,其失败率较低,能够有效用于临床单基因病PGD。(本文来源于《临床检验杂志》期刊2019年02期)

陈慧峰,张金鑫,闫雪华,赵雷,黎丽春[3](2018)在《广东省氡辐射地区人群h OGG1基因5'侧翼区多态性单体型分析》一文中研究指出目的探讨8-羟基鸟嘌呤DNA糖苷酶1(h OGG1)基因5'侧翼区多态性单体型在广东省氡辐射地区汉族人群中的分布及其遗传特征。方法采用Haplo View软件分析本研究前期筛查确证的广东省氡辐射地区汉族人群中h OGG1基因5'侧翼区目的片段(-1721 nt~+164 nt)中8个多态性位点-1493 G> A、-1455 G> A、-1293 A> T、-1187 C> A、-834 G> C、-337 C> A、-323 G> A和-18 G> T的群体遗传学特征、连锁不平衡和单体型分布。结果研究对象h OGG1基因5'侧翼区目的片段(-1721 nt~+164 nt) 8个多态性位点中,除-1293 A> T和-337 C> A外,其余6个位点基因型频率均符合Hardy-Weinberg平衡(P> 0. 05); 8个多态性位点在该人群中均不存在变异纯合基因型,其杂合度分别为-1493 G> A(0. 081)、-1455 G> A(0. 017)、-1293 A> T(0. 361)、-1187 C> A(0. 140)、-834 G> C(0. 017)、-337 C> A(0. 468)、-323 G> A(0. 017)和-18 G> T(0. 065);连锁不平衡分析结果表明,仅-1493 G> A与-18 G> T呈较强的连锁不平衡关系。本研究构建了广东省氡辐射地区汉族人群中4种多态性单体型,其中主要的野生单体型(H1)频率为87. 4%,其余3种为变异单体型(H2~H4),频率为9. 3%。结论阐明了广东省氡辐射地区汉族人群h OGG1基因5'侧翼区多态性单体型分布及其群体遗传特征。(本文来源于《中国职业医学》期刊2018年05期)

林飞,王洁,李东,刁振宇,张宁媛[4](2018)在《单体型分析技术在PGD中的应用》一文中研究指出目的:探讨单体型分析技术在胚胎种植前遗传学诊断(PGD)中的应用方法:单体型(Haplotype)是指一条染色体特定区域内相互连锁,倾向于以整体遗传给后代的单核苷酸多态(SNP)的组合。PGD检测过程中常运用多重PCR联合二代测序(NGS)的方法检测单个基因(或拷贝数异常的特定区域)以及其上下游一定范围内的高频SNP位点,结合已知的家系基因型结果,分析与基因型连锁的单体型遗传关系。进而通过检测胚胎的单体型情况,达到对胚胎基因型进行诊断的目的。本文结合本中心PGD检测工作以及相关研究进展,探讨单体型(本文来源于《第十一届全国遗传病诊断与产前诊断学术交流会暨第二届海峡两岸医药卫生交流协会遗传与生殖专业委员会年会论文集》期刊2018-08-03)

邹先炎[5](2018)在《基于GWAS挖掘棉花优异纤维相关位点及全基因组单体型分析》一文中研究指出棉花是世界上重要的经济作物之一,其棉纤维不仅是纺织工业的原材料,而且可以作为纤维能源应用于工业发展,研究纤维发育机理对于棉纤维改良具有重要意义。本研究收集了278份棉花品系材料组成自然群体,利用简化基因组(SLAF-seq)技术开发单核苷酸多态性(SNP)标记,基于SNP标记进行全基因组关联分析(GWAS)和全基因组单体域(LD Block)及单体型(Haplotype)分析。同时结合生物信息方法学和实时荧光定量实验,分析棉花四个物种全基因组纤维素合成酶基因的进化情况及其在纤维发育过程中的表达模式,这些为进一步改良棉花纤维育种工作和解析纤维发育分子机制奠定了一定的基础。利用简化基因组测序(SLAF-seq)技术共开发到SNP标记3,464,561个,在完整度0.85,最小等位基因频率0.05水平上过滤得到SNP标记54,541个。在此基础上,分别进行了群体的群体结构、主成分分析及系统进化树,结果表明该群体可以分为叁个亚群,这叁个亚群在纤维强度上差异达到极显着(p<0.01)。通过全基因组关联分析,共关联(p<9.46e-8)到分别与纤维强度(FS)、纤维长度(FL)、纤维马克隆值(FM)和衣分(LP)相关的优异位点各670、678、1393和476个。基于连锁不平衡原理,分析全基因组范围的单体域及其内部的单体型频率,得到分别与FS、FL、FM和LP相关的单体域各15、14、25和31个。并进一步分析了其中一个单体域(Block4)内的叁个单体型,发现Hap1与LP相关,而Hap3与FS和FL相关。这些与目标性状相关优异位点有助于下一步候选基因的筛选,而单体域及单体型的结果可能为分子育种工作提供一定的参考。GWAS候选基因中有两个在纤维发育28DPA时期超高表达的基因(Gh_A08G0421和Gh_A05G3965)注释到纤维素合成酶基因,维素合成酶是影响细胞壁合成过程中控制纤维素合成的一种非常重要的蛋白质。通过生物信息学方法,系统分析了陆地棉、海岛棉、亚洲棉和雷蒙德氏棉四个棉种的纤维素合成酶在全基因组上的进化和在纤维发育时期的表达模式。在整个棉花纤维合成酶进化过程中,直系同源基因和旁系同源基因受纯化选择(d_N:d_S<1),而在各个亚家族枝系之间,CSLJ亚家族受到一定的正向选择压力,枝-位点模型分析发现CSLJ和CSLG枝系在纤维素合成酶蛋白的CSR区分别含有1个和2个正向选择位点,这可能会影响功能分化的方向。利用转录组数据分析和qRT-PCR实验验证,发现在四个棉种纤维发育过程中,均至少有一半以上的基因表达,且具有一定的表达差异性,同一亚家族的不同成员表达量差异很大,如GhCesA8_02在次生壁加厚期几乎不表达,而GhCesA8_01和GhCesA8_03的表达量(FPKM值)则超过1000。启动子分析也表明,差异表达的同源基因间,其上游启动子区顺式作用元件也有较大变化。这些结果可能为进一步分析棉花纤维素合成酶基因的功能和表达模式具有一定的参考价值。(本文来源于《中国农业科学院》期刊2018-05-01)

罗凯,陈敏,卢森,赖峥菲,曾艳欣[6](2017)在《基于母体血浆单体型分析无创产前检测脊髓性肌肉萎缩症的研究》一文中研究指出目的:探索无创产前检测(NIPT)脊髓性肌肉萎缩症(SMA)在临床应用的可行性。方法:招募生育过SMA先证者且再次妊娠的24个家系,其家系中夫妻双方及先证者致病突变经多重连接探针扩增技术(MLPA)测定。采集家系外周血及孕11周以后的孕妇血浆,通过目标序列捕获及高通量测序技术,首先对夫妻双方及先证者外周血DNA样品进行目标区域捕获测序,获得与致病位点连锁的亲本单体型信息,再结合血浆测序数据中提供的单核苷酸多态性位点的分析结果,构建隐马尔可夫模型,推断胎儿单体型,从而得到胎儿的基因型。同时利用有创产前诊断MLPA检测验证其准确性。本次研究主要针对SMN1基因第7、8号外显子的检测。结果:24个家系通过NIPT检测检出患胎5例,携带者7例,余12例正常;MLPA检测结果为5例患胎,8例携带者,11例正常。患胎均为SMN1基因第7、8号外显子纯合缺失。NIPT与MLPA检测结果一致率为95.83%(23/24),两种方法诊断结果差异无统计学意义(P=0.317)。结论:基于母体血浆目标区域捕获测序、单体型分析NIPT胎儿SMA风险的方法准确、安全,应用于有先证者遗传信息的SMA NIPT有一定可行性。(本文来源于《实用妇产科杂志》期刊2017年09期)

邵雷,林红[7](2017)在《江苏地区汉族人群HLA-G 3'非翻译区基因多态性和单体型分析》一文中研究指出目的调查江苏地区合格献血者HLA-G 3'非编码区(3'-UTR)基因多态性和单体型特征。方法提取江苏地区合格献血者全血基因组DNA,PCR方法扩增HLA-G 3'UTR,利用基因测序对多态性位点进行基因分型,直接计算基因频率和基因型频率,利用SHEsis软件分析单体型。结果江苏地区88名献血者HLA-G 3'UTR共有8个多态性位点:+2960 14 bp插入/缺失,+3003C/T,+3010C/G,+3027A/C,+3035C/T,+3142C/G,+3187A/G,+3196C/G,其基因频率及基因型频率均符合Hardy-weinberg平衡定律(P>0.05);各位点紧密连锁(D'>0.7),SHEsis软件分析求得频率>0.03的单体型有6种,其中单体型UTR-3(DTCCCG AC,频率=0.256)最为常见。结论本研究分析了江苏地区合格献血者HLA-G 3'UTR的8个多态性位点、连锁不平衡和单体型频率的特征,对于研究本地区HLA-G的基因多态性以及与相关疾病的关系提供了重要依据。(本文来源于《中国输血杂志》期刊2017年03期)

陈林君,刁振宇,徐志鹏,周建军,颜桂军[8](2017)在《基于新一代测序的SNP单体型分析在先天性挛缩性蜘蛛样指症PGD中的应用》一文中研究指出目的探讨基于新一代测序(NGS)的单核苷酸多态性(SNP)单体型分析在先天性挛缩性蜘蛛样指症(CCA)种植前遗传学诊断中的有效性。方法对活检的滋养层细胞采用多重置换扩增(MDA)的方法扩增全基因组,应用基于NGS的SNP单体型分析和直接测序两种方法对MDA产物进行CCA的种植前遗传学诊断(PGD)。结果应用MDA方法对活检的4枚囊胚的滋养层细胞成功地进行了全基因组扩增;通过基于NGS的SNP单体型分析发现,其中两枚是未感染CCA的囊胚,另两枚是感染CCA的囊胚;单体型分析结果与直接测序法结果一致。取卵5个月后患者移植一枚基因型正常的冷冻囊胚,于妊娠的第38周经剖宫产成功分娩一体重为2 850g的健康婴儿。结论基于NGS的SNP单体型分析是单基因病的种植前遗传学诊断的有效筛查工具。(本文来源于《生殖医学杂志》期刊2017年01期)

邵雷,胡国龙,林红,桂霞[9](2016)在《汉族与新疆维吾尔族人群白细胞抗原-G 3'非翻译区基因多态性和单体型分析》一文中研究指出目的了解中国汉族与新疆维吾尔族合格献血者G 3'UTR基因多态性和单倍型分布规律和差异。方法分别提取来自汉族184例和维吾尔族104例,共288例无血缘关系合格献血者全血DNA,采用PCR方法扩增3'UTR,直接测序,对此区段的单核苷酸多态性位点进行基因分型,直接计算基因频率和基因型频率,利用SHEsis和SPSS19.0等软件进行单体型分析和卡方检验。结果本研究在两个人群中共检测到10个SNP位点,分别为+2960 14bp插入/缺失、+3003C/T、+3010C/G、+3027A/C、+3035C/T、+3092 T/G、3121 T/C+3142C/G、+3187A/G、+3196C/G,其中+3092(本文来源于《中国输血协会第八届输血大会论文专辑》期刊2016-11-08)

徐晓丽[10](2015)在《目标区域捕获高通量测序结合单体型分析技术用于胚胎植入前PKD2基因突变检测》一文中研究指出目前胚胎植入前遗传学检测(诊断/筛查)的主要方法有单细胞PCR、荧光原位杂交(FISH)、微阵列比较基因组杂交(arrayCGH),单核苷酸多态性微阵列(SNP arrays)和新一代高通量测序(NGS)。前两种检测方法或实验流程复杂,或检测周期很长,或费用昂贵,有时还需要特殊的定位和收集大量家系样本。而后面叁种方法是最新的单细胞基因组分析方法,具有高灵敏度、高通量及检测周期短等优点,在之后的研究中将不断取代PCR和FISH。近年来,新一代测序技术迅速发展,并且越来越多的应用在医学检测领域,该技术检测范围广、高通量、稳定性好,测序成本也将越来越低。而将新一代测序技术与目标区域捕获技术相结合,还能自由选择检测区域,进一步降低检测成本。本研究通过目标区域捕获高通量测序结合单体型分析对一个PKD2第一外显子及内含子存在杂合缺失c.(595_595+14)delGGTAAGAGCGCGCGA的家系进行研究,评估该方法用于胚胎植入前PKD2基因检测的可行性。本研究中,我们定制了一种芯片,该芯片能完成对21个基因的外显子、各基因周围约2000个SNP(次要等位基因频率>0.3)以及X、Y染色体特异性区域的捕获。我们通过目标区域捕获高通量测序结合单体型分析技术共测试了10个样本,其中7个为该家系的胚胎样本。以Sanger测序结合单体型分析评估本研究方法的可行性。10个样本经目标区域捕获高通量测序共产生7.09G的测序数据。用于区分胚胎单体型的SNP总数为24,142个,平均每个单体型为287个。捕获测序单体型分析结果显示第3号、5号、6号胚胎没有遗传父亲的致病单体型,而第1号,2号,4号,7号胚胎遗传了父亲的致病单体型而被判断为异常胚胎。这一结果与Sanger验证方法一致,准确率为100%。而捕获测序性别数据显示6号胚胎出现了缺X染色体的现象,这一结果与array-CGH的结果一致。通过本研究,我们得出目标区域捕获高通量测序结合单体型分析技术可用于胚胎植入前PKD2基因突变的检测,并且具有高灵敏度、高保真性、高通量及检测周期短等优点。(本文来源于《华南理工大学》期刊2015-10-25)

单体型分析论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

目的探讨单核苷酸多态性(SNP)单体型分析在单基因遗传病植入前遗传学诊断(PGD)中的临床应用价值。方法活检囊胚滋养层细胞全基因组扩增产物,应用SNP单体型分析方法进行诊断,并用Sanger测序进行验证。结果共205枚胚胎同时完成了SNP单体型分析和Sanger测序验证,155枚胚胎(75.61%)诊断结果一致,18枚胚胎(8.78%)诊断结果不一致。Sanger测序失败有30枚胚胎(14.63%),单体型分析有2枚胚胎(0.98%)失败,后者诊断失败率明显低于前者(P<0.05)。41个移植周期共45枚胚胎移植,临床妊娠率为70.73%(29/41),种植率为71.11%(32/45)。胎儿中孕期羊水产前诊断结果与胚胎单体型分析诊断结果一致。结论 SNP单体型分析准确性好,与Sanger测序相比,其失败率较低,能够有效用于临床单基因病PGD。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

单体型分析论文参考文献

[1].周银生.单体型分析的算法研究[D].中国科学技术大学.2019

[2].王江,朱家红,刘东云,熊顺,韩伟.SNP单体型分析在单基因遗传病PGD中的应用[J].临床检验杂志.2019

[3].陈慧峰,张金鑫,闫雪华,赵雷,黎丽春.广东省氡辐射地区人群hOGG1基因5'侧翼区多态性单体型分析[J].中国职业医学.2018

[4].林飞,王洁,李东,刁振宇,张宁媛.单体型分析技术在PGD中的应用[C].第十一届全国遗传病诊断与产前诊断学术交流会暨第二届海峡两岸医药卫生交流协会遗传与生殖专业委员会年会论文集.2018

[5].邹先炎.基于GWAS挖掘棉花优异纤维相关位点及全基因组单体型分析[D].中国农业科学院.2018

[6].罗凯,陈敏,卢森,赖峥菲,曾艳欣.基于母体血浆单体型分析无创产前检测脊髓性肌肉萎缩症的研究[J].实用妇产科杂志.2017

[7].邵雷,林红.江苏地区汉族人群HLA-G3'非翻译区基因多态性和单体型分析[J].中国输血杂志.2017

[8].陈林君,刁振宇,徐志鹏,周建军,颜桂军.基于新一代测序的SNP单体型分析在先天性挛缩性蜘蛛样指症PGD中的应用[J].生殖医学杂志.2017

[9].邵雷,胡国龙,林红,桂霞.汉族与新疆维吾尔族人群白细胞抗原-G3'非翻译区基因多态性和单体型分析[C].中国输血协会第八届输血大会论文专辑.2016

[10].徐晓丽.目标区域捕获高通量测序结合单体型分析技术用于胚胎植入前PKD2基因突变检测[D].华南理工大学.2015

论文知识图

一43a.基本形图4一34b./曲尺0形式图4一...技术原理示意图位点连锁不平衡分析图家系1的系谱图及单体型分析一3,cGHT家系1(s均已知致病基因候选区...4个微卫星标记在家系中的单体型分

标签:;  ;  ;  ;  ;  ;  ;  

单体型分析论文_周银生
下载Doc文档

猜你喜欢