基于Hadoop的重叠基因对数量的计算方法

基于Hadoop的重叠基因对数量的计算方法

论文摘要

基因组间的相似性可以通过重叠基因对的数量进行度量,基因组数据量的指数增长对重叠基因对数量的计算方法提出了更高的要求,业界迫切需要一种能够处理各种数量级别的基因数据库和待查询基因组的计算工具.本文提出一种基于Hadoop的重叠基因对数量的计算方法——DBits.在较小的数据集上,DBits的计算时间少于业界最常用的方法BITS,而在BITS无法处理的海量数据集上,DBits可以进行有效计算.DBits充分发挥分布式计算在大数据处理中的优势,可用于对数据量较大的基因组进行分析,有效地解决了现有技术中存在的重叠基因对数量计算难的问题.

论文目录

  • 1 相关工作
  • 2 方法
  •   2.1 BITS方法
  •   2.2 分布式的BITS方法——DBits
  •   2.3 DBits的详细介绍
  •   2.4 DBits方法的伪代码
  • 3 实验
  •   3.1 实验数据说明
  •     (1)真实数据
  •     (2)模拟数据
  •   3.2 实验环境
  •   3.3 实验结果
  •     (1)运行时间
  •     (2)性能
  • 4 结论
  • 文章来源

    类型: 期刊论文

    作者: 刘书田,江育娥,林劼

    关键词: 生物信息学,基因组,重叠基因对,大数据

    来源: 福建师范大学学报(自然科学版) 2019年06期

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用

    单位: 福建师范大学数学与信息学院

    基金: 国家自然科学基金资助项目(61472082),福建省自然科学基金资助项目(2014J01220)

    分类号: Q811.4;TP311.13

    页码: 29-39

    总页数: 11

    文件大小: 1455K

    下载量: 34

    相关论文文献

    • [1].大肠杆菌基因组中重叠基因注释的机器学习优化方法[J]. 中国生物化学与分子生物学报 2018(08)
    • [2].不同级别胶质瘤细胞系与侵袭和转移相关的重叠基因[J]. 西部医学 2008(05)
    • [3].不同级别胶质瘤细胞系生长调节相关重叠基因的鉴定[J]. 四川医学 2008(07)
    • [4].重叠基因结构及生物学功能的研究进展[J]. 科教文汇(中旬刊) 2020(07)
    • [5].基于SDNA-GA优化的模糊神经网络控制[J]. 控制与决策 2014(04)
    • [6].现代生物学基因研究进展——从遗传因子到超级基因(1)[J]. 生物学通报 2009(03)
    • [7].原核生物基因识别问题的相关分析[J]. 科技与创新 2017(01)
    • [8].基因概念的发展历程[J]. 科技风 2009(11)
    • [9].东北生态类型单雌蓖麻遗传规律研究[J]. 内蒙古民族大学学报(自然科学版) 2009(02)

    标签:;  ;  ;  ;  

    基于Hadoop的重叠基因对数量的计算方法
    下载Doc文档

    猜你喜欢