长链非编码RNA-蛋白质相互作用及疾病关联算法的研究

长链非编码RNA-蛋白质相互作用及疾病关联算法的研究

论文摘要

长链非编码RNA(lncRNA)是长度大于200碱基,且可以通过折叠的方式形成稳定的空间结构,但是不能编码蛋白的RNA。随着下一代测序技术与生物信息学的发展,近年来lncRNA研究引起了越来越多的关注,深入探讨lncRNA与蛋白质的相互作用关系以及疾病关联分析是推断lncRNA功能和深入研究lncRNA的主要途径。目前lncRNA与蛋白质的互作预测仍处于初步阶段。lncRNA在众多生物学通路与生物分子功能中扮演着重要的角色,且与众多疾病的发生、发展息息相关,lncRNA通过生物大分子之间的相互作用来实现生物学功能,lncRNA最重要的分子机制之一是与蛋白质的相互作用。网络科学的兴起以及其在生物信息学领域的应用深入也为lncRNA的深入挖掘提供新的方法。目前已经有多种预测lncRNA与蛋白质相互作用的方法被提出。主要分为两大类预测lncRNA与蛋白质相互作用的方法:第一大类是基于序列、结构及理化性质的内在特征预测lncRNA与蛋白质相互作用的计算模型;第二大类是基于网络方法的外部关联预测lncRNA与蛋白质相互作用的计算模型。一方面反映了学界对lncRNA与蛋白质分子相互作用关系的这一问题有着浓厚的兴趣和一定的重视,另一反面也表现了机器学习与网络科学在探索生物领域所蕴含的远大前景。在本研究的第一部分,分别对基于机器学习与网络分析方法预测lncRNA与蛋白质相互作用的计算模型进行了系统和全面地分析与比较,归纳了这两大类计算方法的不同优缺点,以及适用范围。这部分内容不仅可以全面地展示当前lncRNA与蛋白质分子相互作用的研究进展,帮助用户在不同的数据集下选择合适的预测相互作用的方法,最终取得更加可靠的相互作用结果。在本研究的第二部分,提出了新的预测lncRNA与蛋白质分子相互作用的算法。构建异质网络,利用网络表示学习DeepWalk算法深度挖掘分子外部的关联特征以及异质网络中生物分子间的拓扑结构信息,构建多种分类器模型预测lncRNA与蛋白质的互作,并进一步与其他预测lncRNA-蛋白质互作的算法相比较,本部分提出的算法在效果和方法方面都有着良好的表现。此外,目前已收录在公开数据库中的lncRNA与疾病关联的数目相比于已经鉴定出来的lncRNA的数目是不能相提并论的,仅有极少一部分lncRNA与疾病关联的数据,为此,在本文第三部分的研究中,构建了利用异质网络拓扑相似性的lncRNA与疾病关联的预测模型。首先构建了包括lncRNA-microRNA的相互作用、lncRNA-疾病的关联、microRNA-疾病的关联、lncRNA-lncRNA的相互作用和疾病-疾病的相互作用所组成的异质网络,基于DeepWalk得到节点的向量表示,计算拓扑相似性并基于规则推理预测潜在的lncRNA与疾病关联的计算方法。利用10折交叉验证,与同样基于网络方法预测lncRNA与疾病关联的计算模型RWRHLD和RWRlncD进行比较,并进一步基于文本挖掘对预测结果进行验证与比较,本部分提出的预测lncRNA与疾病关联的计算方法获得了令人满意的表现,并优于RWRHLD和RWRlncD算法。通过本文的研究,总结并讨论了lncRNA与蛋白质相互作用预测的计算方法,并提出了新的基于异质网络中挖掘隐藏的拓扑结构信息提取分子外部关联的特征,构建机器学习模型预测lncRNA与蛋白质相互作用的计算方法。此外,构建lncRNA与疾病关联的异质网络,基于拓扑相似性质的关联规则预测lncRNA与疾病关联。通过本文的工作可以有助lncRNA的功能推断,全面推动lncRNA的研究。

论文目录

  • 摘要
  • abstract
  • 第1章 绪论
  •   1.1 lncRNA简介
  •   1.2 lncRNA鉴定
  •   1.3 lncRNA功能注释—通过共表达数据推断lncRNA功能
  •   1.4 lncRNA功能注释—通过分子相互作用以及结构信息进行功能推断
  •   1.5 预测lncRNA-蛋白质相互关联的计算方法的研究现状
  •   1.6 预测 lnc RNA-疾病相互关联的计算方法的研究现状
  •   1.7 本文研究内容及创新点
  • 第2章 预测lncRNA-蛋白质相互关联计算方法的系统分析
  •   2.1 基于机器学习的从头预测的计算模型的简要分析
  •   2.2 基于网络方法的计算模型的分析
  •     2.2.1 基于网络方法的lncRNA-蛋白的相互作用预测计算模型
  •     2.2.2 基于网络方法的lncRNA-蛋白的相互作用预测计算模型性能评估.
  •   2.3 讨论与小结
  • 第3章 基于深度挖掘异质网络的拓扑相似性预测lncRNA-蛋白质互作的计算方法的研究
  •   3.1 材料及方法
  •     3.1.1 数据的收集与异质网络的构建
  •     3.1.2 基于DeepWalk的特征向量提取
  •   3.2 分类器构建
  •   3.3 实验结果与模型比较
  •   3.4 讨论与小结
  • 第4章 基于深度挖掘异质网络的拓扑相似性预测lncRNA与疾病关联的计算方法的研究
  •   4.1 引言
  •   4.2 材料与方法
  •     4.2.1 数据的收集与异质网络的构建
  •     4.2.2 基于DeepWalk的特征向量提取
  •     4.2.3 基于关联规则推理的预测模型构建
  •   4.3 模型的验证与比较
  • 第5章 研究总结与展望
  • 参考文献
  • 作者简介及在学期间取得的科研成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 张慧

    导师: 梁艳春

    关键词: 长链非编码与疾病的关联,网络科学,机器学习,预测,性能比较

    来源: 吉林大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,自动化技术

    单位: 吉林大学

    分类号: TP18;Q811.4

    总页数: 79

    文件大小: 5566K

    下载量: 194

    相关论文文献

    • [1].皂苷-蛋白质相互作用的研究进展[J]. 中国食品学报 2020(04)
    • [2].蛋白质相互作用数据库[J]. 中国生物化学与分子生物学报 2017(08)
    • [3].基于多特征融合预测蛋白质相互作用界面[J]. 中南民族大学学报(自然科学版) 2017(03)
    • [4].基于蛋白质相互作用网络分析右归丸治疗肾阳虚证的疗效机制[J]. 中国中医药信息杂志 2016(02)
    • [5].基于蛋白质相互作用“热点”区域的小分子药物设计研究进展[J]. 生物物理学报 2015(02)
    • [6].蛋白质相互作用的研究方法及进展分析[J]. 文理导航(中旬) 2018(01)
    • [7].大规模蛋白质相互作用组实验技术及其应用[J]. 生命的化学 2013(05)
    • [8].茶多酚-蛋白质相互作用的研究进展[J]. 食品工业科技 2019(08)
    • [9].蛋白质相互作用时序网络模型及动态性质分析[J]. 湖南理工学院学报(自然科学版) 2018(01)
    • [10].水稻组织特异性蛋白质相互作用网络构建方法[J]. 哈尔滨工业大学学报 2018(11)
    • [11].基于空间映射的蛋白质相互作用网络链接预测算法[J]. 计算机科学 2016(S1)
    • [12].动态加权蛋白质相互作用网络构建及其应用研究[J]. 自动化学报 2015(11)
    • [13].双分子荧光互补在蛋白质相互作用中的应用[J]. 湖北医药学院学报 2014(02)
    • [14].蛋白质相互作用网络演化模型研究进展[J]. 计算机应用 2013(03)
    • [15].通过液质联用鉴定蛋白质相互作用方法的建立[J]. 首都医科大学学报 2013(03)
    • [16].基于组合特征集成的蛋白质相互作用位点预测[J]. 济南大学学报(自然科学版) 2012(01)
    • [17].蛋白质相互作用网络分析的图聚类方法研究进展[J]. 计算机工程与科学 2012(01)
    • [18].荧光共振能量转移动态检测蛋白质相互作用的研究进展[J]. 济宁医学院学报 2012(01)
    • [19].糖-蛋白质相互作用在酶固定及蛋白质识别与分离中的应用[J]. 中国生物工程杂志 2012(04)
    • [20].蛋白质相互作用网络研究的引文分析[J]. 中华医学图书情报杂志 2012(04)
    • [21].蛋白质相互作用预测方法研究进展[J]. 计算机光盘软件与应用 2012(18)
    • [22].蛋白质相互作用研究进展[J]. 生物学通报 2012(11)
    • [23].基于图聚类的蛋白质相互作用网络功能模块探测[J]. 食品与生物技术学报 2011(01)
    • [24].随机抽样对蛋白质相互作用网络度分布的影响[J]. 生物信息学 2011(03)
    • [25].蛋白质相互作用网络的相似子网搜索问题研究[J]. 计算机工程与应用 2010(03)
    • [26].一类蛋白质相互作用网络比对的线性规划算法[J]. 生物物理学报 2010(01)
    • [27].基于多窗口不同特征的蛋白质相互作用位点预测[J]. 安徽大学学报(自然科学版) 2010(05)
    • [28].数据来源对蛋白质相互作用网络度分布的影响[J]. 生物数学学报 2010(04)
    • [29].蛋白质相互作用网络进化分析研究进展[J]. 生物化学与生物物理进展 2009(01)
    • [30].蛋白质相互作用网络的几种聚类方法综述[J]. 国防科技大学学报 2009(04)

    标签:;  ;  ;  ;  ;  

    长链非编码RNA-蛋白质相互作用及疾病关联算法的研究
    下载Doc文档

    猜你喜欢