基于智能计算的增强子分类预测研究

基于智能计算的增强子分类预测研究

论文摘要

随着分子生物学与统计学的发展,越来越多的新技术被用于基因组序列信息的研究中,其中针对增强子的识别研究技术也有了很大的改进。但是大多数的增强子研究还是通过实验、基因测序方法实现,存在很大的局限性。目前为止,大部分的研究都集中于从其他的调控元件中预测增强子,只有少部分的研究着重于增强子及其强弱类型的预测研究。为促进增强子研究工作并提高研究效率,本文主要基于智能计算,采用多种特征提取方法研究探讨增强子及其强弱类型的预测问题,具体的工作包括以下几个方面:1)概述了生物学中增强子的相关概念,包括强增强子和弱增强子的概念,以及增强子分类预测的研究背景及研究意义,简述了增强子的相关研究方法,并对本文的研究工作做了整体安排。2)概述了几种常用的序列特征提取方法,分析了相关的机器学习算法原理,以及这些算法在DNA序列等研究中的使用情况,学习算法包括支持向量机(SVM)、随机森林(RF)等,此外还介绍了一些分类器的性能评价指标。3)实现了增强子及其强弱类型的分类预测研究。根据转录激活能力和表达能力,将增强子主要分成了两类:强增强子和弱增强子。通常情况下强增强子控制转录或蛋白代谢的相关功能,进而促进转录和增强外源基因的表达水平,对真核生物的基因转录至关重要。因此,预测增强子和预测已识别的增强子属于其强弱类型的哪一种是非常有必要的。最后本文通过两个研究方案实现了对增强子及其强弱类型的分类预测研究。4)总结了本文现阶段的研究工作,同时对今后的研究工作进行了展望。为DNA序列信息的相关研究拓展了研究思路并提供了研究方法借鉴。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 增强子及其强弱类型
  •     1.1.1 增强子
  •     1.1.2 强增强子和弱增强子
  •   1.2 增强子预测分类研究背景及研究意义
  •     1.2.1 增强子预测分类研究背景
  •     1.2.2 增强子预测分类研究意义
  •   1.3 论文的研究内容及结构划分
  • 2 常用的基因组序列特征提取方法
  •   2.1 核苷酸成分法
  •     2.1.1 单核苷酸组成成份法
  •     2.1.2 二联核苷酸组成成份法
  •     2.1.3 三联核苷酸组成成份法
  •   2.2 伪K联核苷酸成分法
  •     2.2.1 基于核苷酸结构属性的伪K联核苷酸成分法
  •     2.2.2 基于核酸蛋白质理化属性的伪K联核苷酸成分法
  •     2.2.3 基于多窗口的伪K联伪核苷酸成分法
  •   2.3 基于核苷酸理化性质及密度分布的融合特征法
  •     2.3.1 核苷酸的物理化学属性
  •     2.3.2 核苷酸的密度分布
  •   2.4 基于三联核苷酸理化属性的移动平均法
  •   2.5 本章小结
  • 3 常用的机器学习分类算法及评价
  •   3.1 常用的机器学习分类算法
  •     3.1.1 支持向量机
  •     3.1.2 随机森林
  •     3.1.3 K-近邻
  •     3.1.4 人工神经网络
  •   3.2 常用的检验方法与评价指标
  •     3.2.1 分类算法的检验方法
  •     3.2.2 分类算法的评价指标
  •   3.3 本章小结
  • 4 增强子及其强弱类别的预测研究
  •   4.1 基准数据集
  •     4.1.1 单核苷酸频率统计分析
  •     4.1.2 二联核苷酸频率统计分析
  •     4.1.3 三联核苷酸频率统计分析
  •   4.2 预测增强子及其强弱类别方案一
  •     4.2.1 基于核苷酸理化属性的多种特征融合
  •     4.2.2 分类模型的构建结果与分析
  •   4.3 预测增强子及其强弱类别方案二
  •     4.3.1 基于SAAC的 DNA核苷酸理化性质及密度分布的特征融合
  •     4.3.2 基于支持向量机构建两层分类模型
  •     4.3.3 预测结果与分析
  •     4.3.4 ROC曲线图
  •   4.4 与现存方法比较
  •   4.5 本章小结
  • 5 总结与展望
  •   5.1 总结
  •   5.2 展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间参加的项目和所发表的论文
  • 文章来源

    类型: 硕士论文

    作者: 颜青玲

    导师: 肖绚

    关键词: 增强子,强增强子,弱增强子,交叉验证

    来源: 景德镇陶瓷大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,生物学,自动化技术

    单位: 景德镇陶瓷大学

    分类号: Q811.4;TP18;O212

    DOI: 10.27191/d.cnki.gjdtc.2019.000058

    总页数: 64

    文件大小: 4057K

    下载量: 39

    相关论文文献

    • [1].肿瘤超级增强子的作用及其临床意义的研究进展[J]. 东南大学学报(医学版) 2020(03)
    • [2].超级增强子在肿瘤研究中的进展[J]. 遗传 2019(01)
    • [3].增强子诱捕研究进展及其在家蚕中的应用展望[J]. 蚕学通讯 2008(03)
    • [4].《细胞》:科学家为近百种"超级增强子"编制目录[J]. 现代生物医学进展 2014(06)
    • [5].增强子预测及靶向测序技术研究进展[J]. 中国畜牧兽医 2019(05)
    • [6].《细胞》:科学家为近百种"超级增强子"编制目录[J]. 现代生物医学进展 2014(03)
    • [7].增强子功能鉴定及其在农业动物中的研究进展[J]. 中国细胞生物学学报 2019(07)
    • [8].超级增强子的发现与研究进展[J]. 国际生殖健康/计划生育杂志 2017(02)
    • [9].增强子RNA研究现状[J]. 遗传 2017(09)
    • [10].前列腺癌相关超级增强子RNA鉴定及调控功能分析[J]. 生物化工 2020(04)
    • [11].巨细胞病毒增强子提高人甲胎蛋白启动子效率的研究[J]. 中国细胞生物学学报 2013(04)
    • [12].增强子及其生物信息学预测[J]. 生命的化学 2011(03)
    • [13].骨质疏松易感SNP rs4325274通过增强子远程调控SOX6基因的功能机制研究[J]. 遗传 2020(09)
    • [14].基于多特征融合的增强子-启动子相互作用预测综述[J]. 计算机科学 2020(05)
    • [15].肝癌中增强子调控miRNA前馈环路的识别与功能分析[J]. 生物技术通报 2019(05)
    • [16].脂肪组织特异性表达载体的构建[J]. 青岛农业大学学报(自然科学版) 2012(02)
    • [17].猪乳糖酶基因启动子及增强子的活性研究[J]. 畜牧与兽医 2014(03)
    • [18].DHX15在HBV复制中的意义及其机制初步研究[J]. 重庆医科大学学报 2018(11)
    • [19].肺腺癌增强子调控miRNA前馈环路的识别与功能分析[J]. 生物技术通讯 2019(06)
    • [20].超级增强子研究进展[J]. 遗传 2016(12)
    • [21].癌症相关点突变的特征分析[J]. 黑龙江科技信息 2010(08)
    • [22].肝癌增强子-miRNA调控作用对的识别与特征分析[J]. 中国肿瘤生物治疗杂志 2020(07)
    • [23].增强子的鉴定及其在肿瘤研究中的应用[J]. 遗传 2020(09)
    • [24].肝癌细胞HepG2中增强子的识别及生物信息学分析[J]. 生物技术通讯 2017(04)
    • [25].Ezrin增强子敲除可抑制人食管癌Eca-109细胞的增殖和迁移[J]. 中国肿瘤生物治疗杂志 2019(01)
    • [26].SLE患者B细胞TNFAIP3、TNIP1基因启动子、增强子活性的研究[J]. 菏泽医学专科学校学报 2016(01)
    • [27].甘氨酸脱羧酶基因增强子区(-4.2~-2.2 kb)基因图谱绘制及其活性检测[J]. 锦州医科大学学报 2020(02)
    • [28].携带不同数量增强子的嵌合型肝脏特异性启动子的构建及其体外实验研究[J]. 中国生物工程杂志 2012(01)
    • [29].WT1基因增强子构建位点对WT1基因启动子转录活性的影响[J]. 中国病理生理杂志 2008(02)
    • [30].CYP3A4内含子10对CYP3A4基因表达的增强子作用[J]. 昆明医科大学学报 2017(01)

    标签:;  ;  ;  ;  

    基于智能计算的增强子分类预测研究
    下载Doc文档

    猜你喜欢