生物数据的差异分析及应用

生物数据的差异分析及应用

论文摘要

随着高通量测序技术的发展,生物学数据急剧积累,挖掘生物数据中蕴含的信息成为科学研究的热点之一。主要包括核酸、蛋白质、DNA以及基因等分子序列的结构和功能的研究。其中,分子进化与系统发育分析是其中一个重要的内容,如通过对生物分子差异分析探索物种间的进化关系以及物种内分子间的变异与进化。此外,基于基因表达数据的差异表达分析发现复杂疾病的基因标志物为理解癌症的发生的机制,以及癌症等复杂疾病的临床预后和治疗方案制定提供帮助。通过对蛋白质序列和基因表达数据类型的研究,本文探索了流感病毒和肝癌两种生物数据在疾病中差异性表达蕴含信息对疾病致病机理、发展、诊断、防控以及治疗等方面的影响和作用。文章的主要工作概括如下:1)利用氨基酸理化特性对流感病毒的HA蛋白质序列进行40维特征提取,采用层次聚类方法分析蛋白质序列的差异性,并引入最优层次评价指标计算出每一年的最优聚类数。利用每一年的种群熵值刻画流感病毒的生物多样性,进一步,通过变异进化分布图和种群熵变化率对流感病毒的变异进行深入分析。结果表明,种群熵值能很好地反应流感病毒的生物多样性,种群熵变化率也能很好地反应流感病毒的变异速率,这些研究可为流感的预测提供依据和支撑。2)基于肿瘤基因组图谱数据库中所获取的基因表达数据进行了差异分析以区分差异表达基因。其次,采用加权相关性算法以构建差异表达基因的共表达模块,并计算共表达模块与肝癌临床病理分期的相关系数。再选取与病理分期强相关性的模块中基因构建模块基因交互网络。选取与病理T、N、M期相关性最高的模块基因在DAVID数据库中实施富集分析和通路分析,最后,用Cytoscape软件对分子互作网络进行注释、可视化。结果表明,该模块中异常表达的基因在细胞分裂、姐妹染色单体聚合、DNA修复、有丝分裂细胞周期G1/S转化等生物学过程中发挥重要作用。与此同时,这些基因也在细胞周期、卵母细胞减数分裂和p53信号通路中富集。通过研究交互网络的近距离中心性及研究性文献结论发现CKAP2、TPX2、CDCA8、KIFC1、MELK、SGO1、RACGAP1、KIAA1524等8个基因生物标志物,其生物机制证实与肝癌相关。因此8个基因的异常表达可以作为肝癌病理分期诊断的标志物。3)在2)工作的基础上结合肝癌四个临床病理分期的基因表达数据,采用差异分析方法区分不同分期的差异表达基因。再选择Logistic回归寻找对肝癌致病具有统计学显著影响的基因,在ⅰ、ⅱ、ⅲ、ⅳ病理分期的实验中,分别得到192、149、224、112个显著差异表达的基因。进一步,采用分子互作网络分析确定肝癌不同病理分期的基因生物标志物。最后,采用生存分析和文献研究结果验证。其中,MELK,KIFC1,CDCA8,RACGAP1等4个基因生物标志物与2)结果吻合。此外,也发现HJURP,TROAP,NDC80,KIF4A及COLEC10等新的基因生物标志物。结果显示,MELK、HJURP、CDCA8基因可以作为第ⅰ分期的生物标志物,TROAP,NDC80基因可以作为第ⅱ分期的生物标志物,KIF4A基因可以作为第ⅲ分期的生物标志物,RACGAP1基因可以作为第ⅳ分期的生物标志物。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  •   1.1 生物信息学背景
  •     1.1.1 生物信息学研究内容
  •     1.1.2 生物信息学与生物数据
  •     1.1.3 生物信息学与生物医学
  •   1.2 分子进化与系统发育分析
  •   1.3 基因表达数据
  •     1.3.1 基因表达测定原理
  •     1.3.2 基因表达数据的应用
  •   1.4 聚类分析
  •   1.5 生物分子网络
  •     1.5.1 基因互作网络
  •     1.5.2 蛋白质相互作用网络
  •   1.6 本文的主要工作与创新点
  •     1.6.1 本文的主要工作
  •     1.6.2 本文的主要创新点
  • 第二章 基于流感病毒蛋白差异性的进化研究
  •   2.1 材料与方法
  •     2.1.1 数据来源
  •     2.1.2 特征提取
  •     2.1.3 最优聚类评价指标
  •     2.1.4 生物多样性
  •     2.1.5 算法流程
  •   2.2 结果与分析
  •   2.3 结论
  • 第三章 基于基因差异表达的肝癌基因标志物研究
  •   3.1 数据和方法
  •     3.1.1 数据来源及数据预处理
  •     3.1.2 共表达网络模块分析
  •     3.1.3 基因模块与临床信息的相关性
  •     3.1.4 紧密中心性
  •   3.2 实验
  •     3.2.1 差异表达分析
  •     3.2.2 构建共表达网络模块
  •     3.2.3 基因互作网络
  •     3.2.4 富集分析和通路分析
  •   3.3 讨论和分析
  •   3.4 结论
  • 第四章 基于特定分期的肝癌基因标志物研究
  •   4.1 数据及数据预处理
  •     4.1.1 数据来源
  •     4.1.2 差异分析
  •   4.2 方法和模型
  •     4.2.1 基于Logistic回归的寻找显著差异表达基因
  •     4.2.2 基于FWER测度的Bonferroni假设检验
  •     4.2.3 基因互作网络
  •   4.3 讨论分析
  •   4.4 结论
  • 第五章 结论与展望
  •   5.1 主要结论
  •   5.2 工作展望
  • 致谢
  • 参考文献
  • 附录:作者在攻读硕士学位期间发表的论文及参加的学术活动
  • 文章来源

    类型: 硕士论文

    作者: 周加兴

    导师: 唐旭清

    关键词: 流感病毒,差异分析,聚类分析,分子互作网络,基因生物标志物

    来源: 江南大学

    年度: 2019

    分类: 基础科学,医药卫生科技,信息科技

    专业: 生物学,生物学,中医学,计算机软件及计算机应用

    单位: 江南大学

    分类号: R246;Q811.4;TP311.13

    总页数: 46

    文件大小: 2170K

    下载量: 93

    相关论文文献

    • [1].国内外环境会计信息披露差异分析及建议[J]. 时代金融 2019(33)
    • [2].共享经济与租赁经济差异分析[J]. 合作经济与科技 2020(03)
    • [3].新冠肺炎疫情下中小企业主决策行为心理差异分析[J]. 青岛职业技术学院学报 2020(02)
    • [4].声乐伴奏与钢琴演奏的差异分析[J]. 当代音乐 2019(07)
    • [5].高中生数学学以致用能力差异分析与对策[J]. 中国数学教育 2016(20)
    • [6].差异分析给力 破解难题一道[J]. 中学数学研究 2011(09)
    • [7].相对差异分析法:数据寻“异”,试题探“因”——以一次九年级数学期中测试分析为例[J]. 中学数学 2016(16)
    • [8].例谈差异分析在计算中的探路功能[J]. 数学教学 2013(10)
    • [9].差异分析 水到渠成[J]. 福建中学数学 2015(01)
    • [10].对中美英语教师课堂教学的差异分析[J]. 中华少年 2017(05)
    • [11].英汉句子结构的差异分析[J]. 赤子(下旬) 2016(06)
    • [12].汉语与英语表达差异分析[J]. 校园英语 2016(35)
    • [13].浅谈中学生学习英语困难的根源[J]. 中华少年 2017(17)
    • [14].嘉兴话古微母字今读差异分析[J]. 长江丛刊 2017(28)
    • [15].中西方礼貌原则及其差异分析[J]. 文学教育(下) 2020(07)
    • [16].差异分析:从失败走向成功[J]. 数学通讯 2009(05)
    • [17].高职院校会计专业毕业生供求差异分析研究[J]. 内江科技 2020(11)
    • [18].城乡基本公共服务均等化差异分析与改善对策[J]. 乡村科技 2019(35)
    • [19].会计利润与应税所得差异分析[J]. 商 2013(19)
    • [20].船舶发动机排气污染物满足不同标准的差异分析[J]. 船海工程 2020(05)
    • [21].运用差异分析 解决三角问题[J]. 高中生之友 2008(21)
    • [22].新收入准则下会税差异分析及风险规避探讨[J]. 财经界 2020(29)
    • [23].“不合格品审理系统”与“故障报告、分析和纠正措施系统”差异分析[J]. 航空标准化与质量 2020(05)
    • [24].政府会计制度与事业单位会计制度差异分析[J]. 当代会计 2019(08)
    • [25].行业无形资产差异分析[J]. 物流工程与管理 2017(03)
    • [26].大数据思维与传统统计思维方式的差异分析[J]. 无线互联科技 2017(22)
    • [27].税收会计与财务会计的差异分析[J]. 商 2015(40)
    • [28].关于跨文化交际下中西方“面子”观差异分析[J]. 智富时代 2019(02)
    • [29].中学数学解题中渗透差异分析的思想[J]. 考试周刊 2019(83)
    • [30].浙江省直播稻的产量差异分析和发展趋势探讨[J]. 中国稻米 2010(01)

    标签:;  ;  ;  ;  ;  

    生物数据的差异分析及应用
    下载Doc文档

    猜你喜欢