生物医学实体关系抽取算法与应用研究

生物医学实体关系抽取算法与应用研究

论文摘要

生物医学领域的研究因与人类的健康状况密切相关而受到广泛关注。近年来,生物医学文献的数量呈高速增长的态势。海量的生物医学资源一方面成为生物医学专家的宝贵资源,另一方面,由于人工抽取有用的信息耗时耗力,也一定程度上制约了生物医学研究的效率。基于此,生物医学文本挖掘技术适时出现并解决了这一难题。生物医学实体关系抽取是文本挖掘中的重要任务之一。由于目前主流的关系抽取技术是基于深度学习的单任务学习方法,该方法不能有效利用同一领域的相关任务间的共性,使得模型的性能和泛化能力有限。基于此,在本文的工作中,我们构建了多任务学习模型,分别为全共享多任务模型、私有共享多任务模型和基于Attention机制的主辅多任务模型。多任务模型中的私有网络抽取各个任务的私有特征,共享网络可以抽取多个任务之间的公共特征,对私有特征进行补充和增强。特别是,我们提出的基于Attention机制的主辅多任务模型,根据辅助任务对主任务的影响程度,利用Attention层为每个辅助任务与主任务的共享特征分配权重,最大化的利用了辅助任务的积极影响,同时避免了辅助任务的噪声,提升了模型的分类能力。然后,我们使用基于深度学习的关系抽取系统,从无结构的生物医学文献中抽取有用的信息,构建了结构化的专病知识图谱。由于图结构的数据存在难以计算和推理的缺点,我们研究了基于翻译模型和语义匹配模型的知识图谱表示学习方法,将图结构的数据转换为低维连续空间中的向量,便于基于知识图谱的后续工作,如问答系统、知识推理等。在生物医学领域,人类的恶性肿瘤的相关研究对人类的生命健康意义重大,而与恶性肿瘤相关的蛋白质-蛋白质交互作用(PPIs)可以揭示疾病背后的分子机制,受到研究人员的高度重视。虽然已经存在相关结构化的数据库,但是都是由人类学家手工构建的。由于关于PPIs的生物医学文献的数量正在迅速增加,人工抽取PPIs并且构建相关数据库费时费力,效率低下。为此,我们使用基于机器学习的关系抽取系统从生物医学文本中自动抽取出大量人类恶性肿瘤相关的PPIs,构建了一个人类恶性肿瘤相关的蛋白质-蛋白质相互作用数据库。该项工作使得医学研究人员无需挖掘大量生物医学文献,就可以直接获得结构化的PPIs数据,对恶性肿瘤PPIs的研究效率有显著改善。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 研究背景
  •   1.2 研究现状
  •     1.2.1 生物医学实体关系抽取研究现状
  •     1.2.2 知识图谱研究现状
  •     1.2.3 蛋白质-蛋白质交互关系数据库研究现状
  •   1.3 本文工作
  •   1.4 本文结构
  • 2 相关技术与知识
  •   2.1 相关算法
  •     2.1.1 单词的向量化表示
  •     2.1.2 神经网络
  •   2.2 实验数据集
  •   2.3 评价指标
  • 3 基于多任务学习的生物医学实体关系抽取
  •   3.1 引言
  •   3.2 方法
  •     3.2.1 单任务模型
  •     3.2.2 全共享多任务模型
  •     3.2.3 私有共享多任务模型
  •     3.2.4 基于Attention机制的主辅多任务模型
  •   3.3 实验与讨论
  •     3.3.1 数据集与实验设置
  •     3.3.2 两两任务间的多任务学习
  •     3.3.3 所有任务间的多任务学习
  •     3.3.4 Attention机制在主辅多任务模型中的有效性
  •     3.3.5 与其他方法的性能比较
  •   3.4 本章小结
  • 4 原发性肝癌的知识图谱构建及表示学习
  •   4.1 引言
  •   4.2 原发性肝癌的知识图谱构建
  •     4.2.1 知识获取
  •     4.2.2 知识存储
  •   4.3 基于原发性肝癌的知识图谱表示学习
  •     4.3.1 问题引出
  •     4.3.2 知识图谱表示学习方法
  •     4.3.3 实验与讨论
  •   4.4 本章小结
  • 5 人类恶性肿瘤的蛋白质交互关系数据库构建
  •   5.1 引言
  •   5.2 数据库构建方法
  •     5.2.1 生物医学文献PPIs抽取系统介绍
  •     5.2.2 人类恶性肿瘤相关PPIs抽取步骤
  •     5.2.3 PPIs结构化数据格式
  •   5.3 数据库介绍
  •     5.3.1 数据统计
  •     5.3.2 数据质量分析
  •     5.3.3 数据库网站
  •     5.3.4 数据可视化
  •   5.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 攻读硕士学位期间参加学术评测和获奖情况
  • 攻读硕士学位期间参加科研项目情况
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 李青青

    导师: 杨志豪

    关键词: 关系抽取,多任务学习,知识图谱,表示学习,蛋白质蛋白质交互关系

    来源: 大连理工大学

    年度: 2019

    分类: 基础科学,医药卫生科技,信息科技

    专业: 生物学,生物医学工程,计算机软件及计算机应用

    单位: 大连理工大学

    基金: 科技部重大专项,国家重点研发计划《疾病研究精准医学知识库构建》(项目编号:2016YFC0901900)),国家重点研发计划项目课题“面向实体的多源信息感知融合与理解技术研究”(课题编号:2016YFB1001103)

    分类号: R318;TP391.1

    DOI: 10.26991/d.cnki.gdllu.2019.000073

    总页数: 75

    文件大小: 2536K

    下载量: 178

    相关论文文献

    • [1].实体关系抽取综述[J]. 计算机工程与应用 2020(12)
    • [2].小规模知识库指导下的细分领域实体关系发现研究[J]. 情报学报 2019(11)
    • [3].基于句法分析的实体关系抽取[J]. 科技风 2018(15)
    • [4].基于依存句法的实体关系抽取[J]. 电子技术与软件工程 2016(24)
    • [5].实体关系抽取研究综述[J]. 信息工程大学学报 2016(05)
    • [6].基于句法语义特征的中文实体关系抽取[J]. 中文信息学报 2014(06)
    • [7].基于句法语义特征的中文实体关系抽取[J]. 北方文学 2016(20)
    • [8].基于协陪义动词的中文隐式实体关系抽取[J]. 计算机学报 2019(12)
    • [9].面向食品安全事件新闻文本的实体关系抽取研究[J]. 农业机械学报 2020(07)
    • [10].基于双向门控循环单元和双重注意力的实体关系抽取[J]. 广东石油化工学院学报 2020(03)
    • [11].面向招投标领域的远程监督实体关系抽取研究[J]. 计算机工程与应用 2020(17)
    • [12].深度学习实体关系抽取研究综述[J]. 软件学报 2019(06)
    • [13].弱监督军事实体关系识别[J]. 电子设计工程 2018(01)
    • [14].基于三支决策的两阶段实体关系抽取研究[J]. 计算机工程与应用 2018(09)
    • [15].中文实体关系抽取研究综述[J]. 计算机与现代化 2018(08)
    • [16].基于规则和本体的实体关系抽取系统研究[J]. 情报杂志 2010(S2)
    • [17].基于卷积神经网络的旅游领域实体关系抽取[J]. 青海师范大学学报(自然科学版) 2019(04)
    • [18].面向医学文本的实体关系抽取研究综述[J]. 郑州大学学报(理学版) 2020(04)
    • [19].中文开放式多元实体关系抽取[J]. 计算机科学 2017(S1)
    • [20].基于实体关系的犯罪网络识别机制[J]. 计算机应用研究 2011(03)
    • [21].集成学习算法在实体关系抽取中的应用[J]. 西安建筑科技大学学报(自然科学版) 2011(03)
    • [22].中文实体关系抽取研究[J]. 计算机工程与设计 2009(15)
    • [23].实体关系识别中长距离依赖问题的研究[J]. 小型微型计算机系统 2008(02)
    • [24].基于单实体语言模型的实体关系发现和描述[J]. 信息工程大学学报 2008(03)
    • [25].实体关系抽取的技术方法综述[J]. 现代图书情报技术 2008(08)
    • [26].实体关系抽取方法研究综述[J]. 计算机研究与发展 2020(07)
    • [27].基于依存分析的军事领域英文实体关系抽取研究[J]. 情报工程 2019(01)
    • [28].面向中文开放领域的多元实体关系抽取研究[J]. 智能系统学报 2019(03)
    • [29].面向中文专利的开放式实体关系抽取研究[J]. 计算机工程与应用 2015(01)
    • [30].无指导的中文开放式实体关系抽取[J]. 计算机研究与发展 2015(05)

    标签:;  ;  ;  ;  ;  

    生物医学实体关系抽取算法与应用研究
    下载Doc文档

    猜你喜欢