基于层次推断和简约聚类的古生物进化树构建方法研究

基于层次推断和简约聚类的古生物进化树构建方法研究

论文摘要

古生物进化树的构建是探索早期生命起源和进化发展规律的重要途径。对于古生物进化树的构建而言,采集于化石的表征数据是可以依据的主要材料。然而古生物表征数据中存在的缺失值和不适用状态,往往导致古生物进化树难以有效构建。针对上述问题,本文从古生物表征数据的特点出发,通过融入演化分析中的先验知识,提出了一种基于层次推断和简约聚类的古生物进化树构建方法。具体研究内容如下:(1)根据表征数据的特征之间存在逻辑关联的特点,建立特征层次结构模型,进而提出了一种基于层次推断的表征数据中缺失值的填补方法。首先,基于特征层次模型提出了一种层次推断框架,并将距离加权的K近邻法引入该框架填补缺失值。实验表明,上述方法在多个缺失比例下优于模糊优化方法。(2)针对不适用状态导致进化树难以稳定构建的问题,提出了一种基于简约聚类的含不适用状态的进化树构建与优化方法,包括进化树的构建和最优树的搜索两个阶段。在进化树的构建过程中,将特征层次结构模型和特征极向等先验知识融入聚类算法,提出一种简约聚类方法用以构建含不适用状态的进化树。在最优树的搜索阶段,在简约原则的基础上采用模拟退火算法进行启发式地搜索。多个含不适用状态的表征数据上的实验表明,相较于现有处理不适用状态的方法,上述方法构建的进化树与模板树之间的Robinson-Foulds距离平均减少了0.125左右。(3)通过分析古生物表征数据中缺失值的缺失机制和不适用状态,在(2)与(3)的基础上,提出了一种基于层次推断和简约聚类的古生物进化树构建方法。该方法首先结合距离加权的K近邻法和层次推断框架以填补古生物表征数据中的缺失值,在数据可解释的前提下降低数据的模糊性。然后,采用(2)中的方法构建并优化含不适用状态的古生物进化树。实验表明,基于上述方法构建的古生物进化树,与目前普遍认可的进化树的拓扑结构基本一致,验证了该方法在含缺失值和不适用状态的古生物进化树构建方面的有效性。综上所述,本文提出的方法更适合构建含缺失值和不适用状态的古生物进化树的构建,可以为古生物学家为探索生命起源提供了更多的论证资料。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  •   1.1 研究背景与意义
  •     1.1.1 古生物进化树构建的研究意义
  •     1.1.2 古生物进化树构建的国内外研究现状
  •   1.2 本文研究内容和创新点
  •   1.3 文章组织结构
  •   1.4 本章小结
  • 第二章 基于层次推断的表征数据中缺失值的填补方法
  •   2.1 表征数据特征的层次结构建模
  •     2.1.1 表征数据的特征间的逻辑关联分析
  •     2.1.2 表征数据的特征层次结构模型的建立
  •   2.2 基于层次推断的表征数据中缺失值的填补策略
  •     2.2.1 基于特征层次结构模型的层次推断框架
  •     2.2.2 表征数据中缺失值填补的具体步骤
  •   2.3 实验结果与分析
  •     2.3.1 表征数据的数据集
  •     2.3.2 缺失值填补的评价指标
  •     2.3.3 实验结果与分析
  •   2.4 本章小结
  • 第三章 表征数据中含不适用状态的进化树构建与优化
  •   3.1 基于简约聚类的含不适用状态的进化树的构建
  •     3.1.1 基于层次化和不对称的二元特征的简约聚类方法
  •     3.1.2 采用共近裔指数度量分类单元的演化关系
  •     3.1.3 结合简约原则和特征层次模型计算内部节点的特征向量
  •     3.1.4 基于表征数据构建的进化树的树长计算
  •     3.1.5 关于简约聚类构建含不适用状态的进化树的例证
  •   3.2 基于模拟退火算法的进化树的优化
  •   3.3 实验结果与分析
  •     3.3.1 含不适用状态的表征数据集
  •     3.3.2 进化树构建与优化的评价指标
  •     3.3.3 进化树构建与优化的实验结果与分析
  •   3.4 本章小结
  • 第四章 含缺失值和不适用状态的古生物进化树构建方法
  •   4.1 古生物表征数据中的缺失值分析
  •     4.1.1 表征数据中完全随机缺失类型的缺失值
  •     4.1.2 表征数据中随机缺失类型的缺失值
  •   4.2 古生物表征数据中的不适用状态分析
  •   4.3 基于层次推断和简约聚类的古生物进化树构建方法
  •   4.4 古生物进化树构建的实验结果与分析
  •     4.4.1 古生物表征数据集
  •     4.4.2 进化树的度量指标
  •     4.4.3 实验结果与分析
  •   4.5 本章小结
  • 总结与展望
  •   本文总结
  •   未来工作展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间取得的科研成果
  • 文章来源

    类型: 硕士论文

    作者: 申丹丹

    导师: 冯宏伟

    关键词: 古生物进化树构建,特征层次结构,缺失值填补,不适用状态,表征数据

    来源: 西北大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,地质学,自动化技术

    单位: 西北大学

    分类号: Q911;TP18

    总页数: 75

    文件大小: 4682K

    下载量: 36

    相关论文文献

    • [1].微生物进化树构建方法[J]. 现代农业科技 2019(19)
    • [2].进化树[J]. 生物进化 2011(02)
    • [3].将进化树连根拔起![J]. 大自然探索 2009(08)
    • [4].大学生对进化树的常见误解[J]. 教师 2018(11)
    • [5].基于专利的技术进化树的构建与解析[J]. 大连理工大学学报(社会科学版) 2015(02)
    • [6].一株引起厦门地区不同作物感染的Poitrasia circinans分离与鉴定[J]. 科学技术与工程 2018(14)
    • [7].几个重要进化概念的辨析——以脊椎动物的系统发育为例[J]. 生物学通报 2009(11)
    • [8].一种改进的NJ方法及其应用[J]. 北京工业大学学报 2009(02)
    • [9].一种基于Quartet Puzzling和邻接法的进化树构建算法[J]. 计算机研究与发展 2008(11)
    • [10].进化树在专利方案生成中的应用[J]. 农机使用与维修 2020(01)
    • [11].层次聚类在进化树构建中的应用[J]. 淮阴工学院学报 2014(05)
    • [12].基于粗粒化的流感病毒蛋白进化树构建[J]. 模式识别与人工智能 2016(10)
    • [13].不同植物中SnRK1.1激酶的蛋白序列对比[J]. 世界最新医学信息文摘 2018(20)
    • [14].1株近平滑假丝酵母的分离及其鉴定[J]. 微生物学杂志 2011(01)
    • [15].中学生物教具进化树的改进[J]. 知音励志 2016(05)
    • [16].猪Sirtuin3基因的克隆与进化分析[J]. 江西农业学报 2008(12)
    • [17].25个鸡品种DMB2基因序列比较分析[J]. 西南农业学报 2019(08)
    • [18].进化树拓扑路网构建及多停靠点路径规划方法研究[J]. 计算机学报 2012(05)
    • [19].基于进化树的产品模块化粒度分析[J]. 武汉科技大学学报 2015(06)
    • [20].一种改进的进化树构建算法[J]. 计算机与现代化 2012(02)
    • [21].一种新的氨基酸序列进化距离及其应用[J]. 浙江大学学报(农业与生命科学版) 2012(03)
    • [22].基于技术进化树的技术潜力预测方法[J]. 机械设计与研究 2019(03)
    • [23].不同物种支原体的比较基因组学研究[J]. 黑龙江畜牧兽医 2014(19)
    • [24].挂满生命的巨树[J]. 大科技(科学之谜) 2009(10)
    • [25].一种基于模糊聚类的构造进化树方法[J]. 计算机应用 2009(03)
    • [26].平衡进化树自组织网络的设计与实现[J]. 武汉理工大学学报(信息与管理工程版) 2009(03)
    • [27].应用STR基因多态性探讨西藏民族群体的遗传关系[J]. 国外医学(医学地理分册) 2010(01)
    • [28].添加辅酶前体及流加诱导物提高黄嘌呤氧化酶发酵产率[J]. 食品与生物技术学报 2014(04)
    • [29].浅谈系统发生树构建方法[J]. 才智 2009(20)
    • [30].一种改进的进化树算法[J]. 太原理工大学学报 2009(05)

    标签:;  ;  ;  ;  ;  

    基于层次推断和简约聚类的古生物进化树构建方法研究
    下载Doc文档

    猜你喜欢