基于序列的细菌终止子识别

基于序列的细菌终止子识别

论文摘要

转录终止是基因表达的重要调节步骤,而转录的结束由终止子决定。如果基因中没有终止子,则转录不能停止,从而导致基因表达异常。检测细菌中的终止子不仅可以确定细菌生物中的操纵子结构,还可以改善基因组的注释。因此,准确识别转录终止子对于转录调控的研究来说是非常重要的。虽然生物化学实验方法可以清楚准确地识别终止子序列,但是非常耗时且昂贵。为提高效率,人们已提出一些计算方法。这些方法主要分为两类:(1)使用核酸组成信息来描述终止子。(2)将发夹结构特征以及下游的T富含区域作为特征用于描述终止子。由于这些方法不能反映终止子的统计特征,所以本文提出了基于序列信息,用机器学习的方法来识别细菌终止子。本文基于低冗余性基准数据集构建了用于识别细菌转录终止子的“iTerm-PseKNC”模型和“DeepTerm”模型。(1)“iTerm-PseKNC”是基于支持向量机(SVM)开发的终止子预测模型,该模型使用二项分布特征筛选技术得到伪K-元组核苷酸组成(PseKNC)的最佳特征子集,利用五重交叉检验来测试模型的预测性能,结果显示,该模型的预测精度达到了95%的准确率。(2)“DeepTerm”是一个基于卷积神经网络的终止子预测模型。该模型使用One-Hot编码作为输入特征,五重交叉验证测试结果显示“DeepTerm”能够获得99.40%的准确度。为了进一步评估“iTerm-PseKNC”模型和“DeepTerm”模型的泛化能力,本文构建了两个独立测试集,分别是经实验验证了的大肠杆菌和枯草芽孢杆菌Rho非依赖终止子序列。结果表明“iTerm-PseKNC”模型和“DeepTerm”模型都可以识别大肠杆菌独立测试集中的所有终止子序列,在枯草芽孢杆菌独立测试集上的测试精度分别为87.5%和99.24%。本文基于“iTerm-PseKNC”模型建立了的服务网站http://lin-group.cn/server/iTerm-PseKNC/,实验人员不需要做复杂的计算,可以直接使用该网站很轻松的预测序列是否为终止子。

论文目录

  • 摘要
  • abstract
  • 第一章 绪论
  •   1.1 细菌终止子简介
  •   1.2 细菌终止子的研究现状
  •   1.3 本论文的主要内容
  • 第二章 数据集与方法
  •   2.1 数据集构建
  •     2.1.1 大肠杆菌实验数据集构建
  •     2.1.2 数据集优化
  •   2.2 特征提取
  •     2.2.1 伪核苷酸频率
  •     2.2.2 伪核苷酸组分
  •   2.3 特征筛选
  •   2.4 分类算法
  •     2.4.1 支持向量机
  •     2.4.2 LIBSVM软件包简介
  •     2.4.3 神经网络简介
  •     2.4.4 其他分类算法
  •   2.5 分类性能指标
  •     2.5.1 交叉验证
  •     2.5.2 评估指标
  • 第三章 结果与分析
  •   3.1 支持向量机分类结果
  •     3.1.1 参数优化
  •     3.1.2 特征优化
  •     3.1.3 特征分析
  •     3.1.4 终止子与终止密码子间的距离
  •   3.2 神经网络分类结果
  •     3.2.1 基于伪核苷酸表示输入的模型结构
  •     3.2.2 基于One-Hot表示输入的模型结构
  •     3.2.3 模型训练
  •   3.3 多种分类算法结果比较
  •   3.4 独立测试集验证结果
  • 第四章 在线服务软件介绍
  • 第五章 总结与展望
  •   5.1 本文工作总结
  •   5.2 未来工作展望
  • 致谢
  • 参考文献
  • 附录
  • 攻读硕士期间取得的研究成果
  • 文章来源

    类型: 硕士论文

    作者: 冯朝琴

    导师: 林昊

    关键词: 细菌终止子,伪核苷酸组分,支持向量机,卷积神经网络

    来源: 电子科技大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 电子科技大学

    分类号: Q78;TP18

    总页数: 64

    文件大小: 2356K

    下载量: 35

    相关论文文献

    • [1].采用蒙特卡洛法评定转基因水稻样品中NOS终止子的测量不确定度[J]. 计量学报 2019(01)
    • [2].水稻GluB-4终止子的克隆与功能分析[J]. 植物生理学报 2018(10)
    • [3].基于重组酶和终止子的状态调控开关设计[J]. 生物工程学报 2018(12)
    • [4].转基因大豆外源基因NOS终止子定量测定的不确定度分析[J]. 大豆科学 2013(05)
    • [5].转基因水稻外源基因NOS终止子定量测定的不确定度分析[J]. 江西农业学报 2013(10)
    • [6].水稻arf1基因3′-UTR片段的克隆和验证[J]. 应用与环境生物学报 2019(02)
    • [7].枯草芽孢杆菌168新型转录终止子的构建与表征(英文)[J]. 生物工程学报 2017(07)
    • [8].GURTs研发应用现状及其产生的内在原因[J]. 华中农业大学学报(社会科学版) 2010(01)
    • [9].转基因食品你吃吗[J]. 东北之窗 2014(12)
    • [10].三角褐指藻(Phaeodactylum tricornutum)通用转化载体的构建[J]. 生物学杂志 2012(04)
    • [11].豌豆终止子rbc-T在转基因小麦研究中的应用[J]. 作物学报 2017(08)
    • [12].转基因抗草甘膦油菜的检测方法[J]. 生物技术通讯 2012(02)
    • [13].转基因豆粕调控元件在饲料加工中降解变化的初步研究[J]. 华北农学报 2009(02)
    • [14].强化训练暴露问题 提高生物复习效率[J]. 中学教学参考 2014(02)
    • [15].转基因大动物常用载体频数分析及筛查策略[J]. 畜牧兽医学报 2017(12)
    • [16].大肠杆菌内源性转录终止子的支持向量机预测方法[J]. 生命科学研究 2012(06)
    • [17].两种不同终止子在转基因鲤鱼中的促生长效应[J]. 遗传 2009(08)
    • [18].转基因玉米筛选检测阳性标准分子的构建和应用[J]. 玉米科学 2014(06)
    • [19].大肠埃希菌毒力因子ColBM质粒和转录反终止子研究进展[J]. 动物医学进展 2010(05)
    • [20].粘质沙雷氏菌抗铜基因的克隆及性质研究[J]. 云南大学学报(自然科学版) 2008(01)
    • [21].不同加工工艺对大豆转基因成分及调控元件的影响[J]. 大豆科学 2011(01)
    • [22].干热和湿热工艺对大豆转基因成分及调控元件影响的比较研究[J]. 中国粮油学报 2011(10)
    • [23].多重PCR在烟草转基因检测中的应用[J]. 生物技术通报 2008(02)
    • [24].应用单管半巢式PCR技术筛查转基因食品[J]. 食品科学 2015(02)
    • [25].豆腐中转基因大豆成分的检测[J]. 食品安全质量检测学报 2015(08)
    • [26].应用定性PCR技术对番茄品种转基因检测[J]. 食品研究与开发 2013(22)
    • [27].粉碎和膨化工艺对大豆转基因成分及调控元件的影响[J]. 粮油食品科技 2011(02)

    标签:;  ;  ;  ;  

    基于序列的细菌终止子识别
    下载Doc文档

    猜你喜欢