基于宏基因组长片段的基因预测算法基准

基于宏基因组长片段的基因预测算法基准

论文摘要

目前,围绕宏基因组的模拟读长(reads)或片段、全基因组等不同类型的输入数据,新的基因预测算法、软件与工具层出不穷,但存在三方面的问题:一、基于模拟reads或片段得出的结果无法准确反映真实基因的预测效果,而基于全基因组得出的结果不能实现未知物种的预测;二、模拟reads或片段大多小于真实基因的总长度,软件很难预测出完整的基因,甚至丢失部分真实基因;三、长片段基因预测的基准衡量研究较少,大大限制了基因预测在不同领域的应用。针对以上问题,提出基于真实数据长片段基因预测的基准衡量方法。首先,对两个包含20种细菌株的真实序列数据集进行过滤及组装处理;其次,利用组装后得到的长片段支架(scaffolds)作为输入,对6种软件进行基准性能评估;最后,基于评估结果进行错误率上限分析。实验结果表明,在覆盖度较高的数据集上,Prodigal、GeneMarkS-2、MetaGeneAnnotator和FragGeneScan这4种软件错误率接近且最低,在3.5%~22.8%变化;在低覆盖度的数据集上,GeneMarkS-2错误率最低,在27.1%~54.7%变化。

论文目录

  • 0 引言
  • 1 相关工作
  •   1.1 基因预测软件性能对比
  •   1.2 基因预测软件算法思想对比
  • 2 方法
  •   2.1 测试数据集
  •   2.2 软件环境搭建
  •     2.2.1 过滤与组装
  •     2.2.2 ORFs预测
  •     2.2.3 ORFs验证
  •   2.3 基准性能评估
  •     2.3.1 ORFs存储格式
  •       1) 标题包含:
  •       2) ORF信息包含:
  •     2.3.2 性能度量
  •     2.3.3 ORFs的判定
  • 3 实验结果
  • 4 讨论
  •   4.1 软件耗时评估
  •   4.2 敏感性评估
  •   4.3 准确性评估
  •   4.4 F分数评估
  •   4.5 错误率上限分析
  •   4.6 基准过程中存在的问题
  • 5 结语
  • 文章来源

    类型: 期刊论文

    作者: 李瑞琳,尚秋明,韩鑫胤,张裕,祝海栋,LI Weizhong,牛北方

    关键词: 宏基因组,基因预测,开放阅读框,组装,基准衡量

    来源: 计算机应用 2019年S1期

    年度: 2019

    分类: 信息科技,基础科学

    专业: 生物学

    单位: 中国科学院计算机网络信息中心,中国科学院大学,中国互联网络信息中心,克莱格文特研究所

    基金: 国家重点研发计划项目(2016YFC0503607,2018YFB0203903),青海省科技成果转化专项(2016-SF-127),国家自然科学基金资助项目(31771466),中国科学院信息化专项(XXH13504-08),中国科学院战略性先导科技专项(A类)(XDA12000000),中国科学院“百人计划”择优支持项目

    分类号: Q811.4

    页码: 143-149

    总页数: 7

    文件大小: 461K

    下载量: 88

    相关论文文献

    • [1].贝赫切特综合征患者肠道菌群微生物宏基因组学分析[J]. 分子诊断与治疗杂志 2020(01)
    • [2].宏基因组技术在抗生素抗性基因筛选中的初步研究[J]. 广东化工 2020(09)
    • [3].宏基因组学在感染性疾病诊治中的研究进展[J]. 河北医学 2020(05)
    • [4].宏基因组学在白酒酿造领域中的研究及应用[J]. 酿酒科技 2020(06)
    • [5].宏基因组学在病毒研究上的应用概述[J]. 贵州畜牧兽医 2020(04)
    • [6].宏基因组学与人类健康关系研究进展[J]. 中国公共卫生 2019(01)
    • [7].宏基因组技术的研究问题分析[J]. 技术与市场 2016(11)
    • [8].环境工程领域中宏基因组学的应用研究[J]. 绿色环保建材 2017(01)
    • [9].宏基因组学揭示瘤胃微生物多样性及功能[J]. 动物营养学报 2017(05)
    • [10].宏基因组学与中医证候研究[J]. 中华中医药杂志 2017(09)
    • [11].土壤宏基因组学研究方法与应用[J]. 环境科学与技术 2015(S2)
    • [12].宏基因组技术在环境保护及污染改善中的应用[J]. 当代化工研究 2016(04)
    • [13].宏基因组学在传统酱腌菜微生物群落中的应用研究[J]. 中国调味品 2016(08)
    • [14].宏基因组学在纤维素酶研究中的应用进展[J]. 微生物学通报 2015(06)
    • [15].宏基因组学:热带冬季瓜菜病害生物防治新策略[J]. 分子植物育种 2015(05)
    • [16].宏基因组学在微生物学研究中的应用[J]. 现代园艺 2015(19)
    • [17].宏基因组技术在耐药细菌研究中的应用[J]. 国外医药(抗生素分册) 2015(05)
    • [18].宏基因组技术在生物医药领域的应用探讨[J]. 绿色科技 2020(18)
    • [19].基于宏基因组分析桑葚酵素的微生物多样性[J]. 中国食品学报 2020(05)
    • [20].宏基因组学在动物胃肠道微生物研究中的应用[J]. 中国畜牧兽医 2014(12)
    • [21].南美白对虾肠道微生物宏基因组提取方法的比较[J]. 生物技术通报 2013(12)
    • [22].环境微生物宏基因组学数据库利用[J]. 生物技术通报 2015(11)
    • [23].宏基因组技术在生物降解基因研究中的应用[J]. 现代养生 2015(16)
    • [24].宏基因组学及其应用前景[J]. 中国畜牧兽医 2014(03)
    • [25].宏基因组学及其在海洋微生物领域的应用[J]. 广东轻工职业技术学院学报 2013(01)
    • [26].宏基因组学在食品科学领域的应用研究进展[J]. 食品科学 2012(05)
    • [27].宏基因组技术及其在厌氧消化研究中的应用[J]. 沈阳大学学报(自然科学版) 2012(04)
    • [28].宏基因组学在红树林土壤微生物研究中的应用[J]. 广东农业科学 2012(14)
    • [29].宏基因组学及其在医药学中的应用[J]. 海峡预防医学杂志 2011(03)
    • [30].宏基因组学及其研究进展[J]. 中国畜牧兽医 2010(03)

    标签:;  ;  ;  ;  ;  

    基于宏基因组长片段的基因预测算法基准
    下载Doc文档

    猜你喜欢