网络环境下基于ontology的医学知识组织研究

网络环境下基于ontology的医学知识组织研究

冯璐[1]2004年在《网络环境下基于ontology的医学知识组织研究》文中提出本文针对信息组织领域存在的组织问题和检索问题,与具体的医学信息领域相结合,从列举现有医学信息常用的基本组织方法与方式出发,总结出基于ontology的知识组织的必要性与实用性,特别是对于医学信息组织采用ontology手段的重要意义。同时归纳总结了目前已经开发出来的医学ontology的一些基本情况,如UMLS、PharmOKB、ONIONS、GALEN。在研究现有医学ontology的基础上,提出了医学ontology的本质、ontology与医学主题词表的异同,重点建立了医学ontology的样本,并设计和开发了建立医学ontology的方法与步骤。结合上述基于ontology的医学知识组织需考虑的关键问题,最后构建了基于ontology的医学智能信息检索模型,期望从真正意义上解决用户的信息检索问题,实现智能信息检索。

黄新平[2]2017年在《政府网站信息资源多维语义知识融合研究》文中研究表明近年来,我国政府信息公开工作进展迅速,越来越多的政务信息资源通过政府门户网站发布,这些信息涉及到各个领域,关系到国计民生和群众的切身利益,群众对其有着广泛的需求。然而由于政府机构的层次性,且行政机关的隶属不同、分工不同,造成政府网站发布的公开信息具有层次性、地域性、分散性等特点,这些海量的、孤立的、分散状态存在的碎片信息往往使人们束手无策,给公众获取有效信息造成障碍,影响政府公开信息的有效利用。政府网站信息资源数量的急剧增长在为人们获取所需的信息和知识带来更多机遇的同时也带来了更大的挑战。因此面对“信息海洋”与“知识匮乏”的对峙局面,迫切需要采取一定的方式和手段对多来源、多类型的政府网站信息资源进行类聚、重组和融合,构建一个有序高效的政府信息知识体系,为用户提供知识的有效获取与利用。知识融合能够针对多源分布信息的碎片化、冗余性、不完整性等问题,从众多数据源中抽取相关知识,经过知识转换、集成与合并等处理,产生新的集成化知识对象,从而为领域决策问题求解构造有效的知识资源。它为解决政府网站信息资源领域的知识服务问题提供了新思路、新方法和新途径。本文以实现政府网站信息资源的深层次开发和利用为立足点,以满足公众的高效率知识服务为目标,综合运用信息管理学、计算机科学、知识科学、系统科学等多学科的理论方法,拟从知识组织的角度架构政府网站信息资源知识融合框架模型,试图改变知识获取的固有流程,形成新的知识获取过程模型,提出对多源的、分散重复、被淹没的政府网站信息资源进行知识融合的理论框架与解决方案。在此基础上,以语义网、知识本体、知识发现等语义信息组织技术为支撑,尝试在语义环境下分别从内容维度、结构维度、应用维度叁个不同维度探索政府网站信息资源知识融合的实现方法。具体研究内容包括:(1)通过对政府网站信息资源和知识融合等相关概念的阐述,进一步明晰了本文研究对象与研究内容的范畴。同时对本研究具有重要指导意义和参考价值的知识空间理论、知识组织理论、本体理论、知识发现理论进行了理论溯源。其中,知识空间多维度的知识分类与知识管理为本文政府网站信息资源多维度知识融合框架的构建提供了重要的理论支撑。知识组织理论对确定不同维度层级政府网站信息资源知识融合所需要实现的知识表示、知识重组、知识关联、知识聚类等过程具有重要的理论指导作用。本体是实现政府网站信息资源知识融合的有力工具,而知识发现理论则提供了解决政府网站信息资源知识融合问题的技术方案。(2)确定了政府网站信息资源知识融合的目标和原则,从用户信息需求和知识融合功能需求两个方面分析了知识融合需求,明确了知识融合的流程与体系结构等框架构建依据。然后对语义环境下政府网站信息资源知识融合过程中涉及的构成要素、功能要素及要素之间的关系进行了分析,并依此提出了基于语义的政府网站信息资源知识融合逻辑框架,从概念与逻辑层面回答了政府网站信息资源知识融合“做什么”的问题。在提出的基于语义的政府网站信息资源知识融合逻辑框架的基础上,以知识空间理论多维度的知识分类与知识管理,知识融合研究领域对知识类型的划分,以及信息融合研究领域中多源信息融合系统的结构与功能框架为依据,提炼出了由数据级融合、概念级融合、决策级融合构成的知识融合功能结构,并依此分别从内容维度、结构维度、应用维度叁个维度构建了政府网站信息资源多维度知识融合框架,从结构与功能层面回答了政府网站信息资源知识融合“怎么做”的问题。(3)内容维度上数据级融合要解决的关键问题是如何对描述统一的政府网站信息资源内容进行有效的数据关联,通过数据关联,形成知识网络。为此,本文通过对特定主题政府网站信息资源进行细粒度信息抽取、预处理,采用本体驱动的元数据模型对其进行统一的语义描述,构建了政府网站信息资源领域知识本体,并以语义网络表示法为参考,实现了政府网站信息资源的知识表示。在此基础上,引入知识元、知识元—本体映射的概念,利用基于知识元语义链接的数据关联方法实现知识元的统一对象化表示、知识元对象的抽取、知识元对象的属性获取、知识元语义关联度计算等,并依此构造生成对特定主题资源内容进行宏观描述的知识网络。(4)结构维度上概念级融合要解决的关键问题是如何从数据级融合生成的政府网站信息资源知识网络中获取领域概念,并识别领域本体概念关系,通过本体合并,形成能够便于发现彼此间关联规则和模式的分类知识组织体系。针对该问题,本文提出了采用RDF链接定性推理与Voronoi图定量推理相结合的本体形式化表示方法来获取政府网站信息资源领域概念。通过识别领域本体概念关系,构建领域本体概念关系的层次结构,依此获得领域本体概念分类体系。在此基础上,设计基于概念分类的领域本体映射模型,并采用本体概念间语义相似度的计算方法,实现基于概念分类的政府网站信息资源领域知识本体合并,消除政府网络信息资源知识网络中的冗余知识,达到对其进行有效分类组织的目的。(5)应用维度上决策级融合要解决的关键问题是如何对政府网站信息资源知识网络和分类知识组织体系结构中具有关联关系和相似关系的领域知识进行关联聚类,经过知识关联聚类,生成面向决策应用的完整领域知识。基于此问题,本文通过对已有领域知识关联聚类方法进行比较分析,提出基于关联挖掘和语义聚类的领域知识融合方法,该方法涵盖时序关联融合、因果关联融合、凝聚层次聚类融合3种核心领域知识融合算法,进而通过因果关联、时序关联、知识聚类等方法生成能够辅助用户决策的完整领域知识。(6)前文按照政府网站信息资源多维度知识融合框架的结构与功能划分,提出了不同维度层级知识融合实现所需要的方法,这些方法的效果如何,还需要通过实验进行验证。为此,本文搭建了实验所需的软硬件环境,介绍了实验需要应用到的相关工具。对实验数据来源及其主题分布情况进行了描述,明确了不同维度层级知识融合的实验内容。在具体的实验验证上,以政府网站发布的“雾霾防治”主题相关的领域信息资源为例,构建了政府网站“雾霾防治”领域知识本体实例。并以构建的“雾霾防治”领域知识本体为依据,分别对数据级融合提出的基于知识元语义链接的知识网络实现方法、概念级融合提出的基于概念分类的领域知识本体合并方法以及决策级融合提出的基于关联挖掘和语义聚类的领域知识融合方法进行了实验验证,并通过设计定性与定量相结合的评价指标对案例实验结果进行了分析与评价。

肖健[3]2016年在《军事医学本体构建的理论与方法研究》文中提出军事医学是维护、恢复和促进军人健康,从而实现保护、再生和提高战斗力目的的特种医学。军事医学起源于战争的需求,以一般医学为基础,将其科学技术运用于军事活动。随着科技进步和生物医学的发展,新兴学科不断交叉融合;同时,武器装备和军事战略的发展变化又不断提出医学保障新问题和卫生勤务新需要,使得军事医学学科发展越来越壮大、越来越具特殊性。军事医学以一般医学学科为基础,其包含的关于生命、健康、疾病、损伤等领域的生理、病理基础理论是军事医学知识重要组成部分,在此基础上发展的损伤修复机制、作业生理和调控因子以及卫生勤务理论是军事医学的坚实基础。军事医学知识除了沿着医学向纵深方向发展探索外,还向着军事科学知识横向拓展,军事医学领域的特殊需求使得军事医学展现出不同于一般医学的某些特征,从而丰富了军事医学知识体系。军事医学知识系统是一个要素多元、属性多维、形态多态、线性作用与非线性作用并存的复杂系统。传统的知识组织方式如分类法、主题词表等多是一维的,难以揭示军事医学多维复杂的知识体系。因此需要运用更加科学的方式和更先进的技术组织军事医学信息,并实现计算机获取和理解,实现知识表示,再从中提取人们所需要的军事医学知识,从而形成一个真正意义上的完整的知识管理系统。本体(ontology)起源于哲学,20世纪90年代被引入到知识工程领域。它包含领域的核心知识,从语义和知识层面对领域概念进行描述,建立概念模型框架。本体能够发掘领域内隐含的或不明确的知识,促进领域知识的共享和重用,因此本体作为一种知识组织方式越来越受到重视。基于本体方法,根据军事医学学科知识特点,设计知识的分类体系,准确刻画概念之间的关系,能够充分展示军事医学包含的知识点及其内在关联关系,支持多维度、可视化、动态地组织军事医学知识和信息资源,促进军事医学知识交互和分析利用。本研究在广泛调研国内外本体相关文献的基础上,全面研究了本体相关概念、方法、语言和工具,梳理并选取了适合军事医学本体构建的方法和工具。调研了国内外典型通用本体和生物医学本体,为军事医学本体构建提供了借鉴。根据军事医学的医学知识属性,经过分析比较选取了一体化医学语言系统(UMLS)作为可以复用的本体,提高了军事医学本体构建的效率。详细分析并理清了军事医学本体构建相关的理论和方法,提出了一套可行的军事医学本体构建技术路径,最后以军事医学顶层本体构建为落脚点,对军事医学本体构建进行了示范研究及论证。本论文的重点研究内容和结论分为以下四个部分。第一部分,本体研究理论和实践基础的情报调研。重点梳理了本体的起源、概念内涵及分类,比较了7种本体构建方法,3种本体表示语言,分析了本体构建工具的使用标准,为军事医学本体构建提供了理论和技术支撑。探析了3种典型通用顶层本体、4种国外典型生物医学本体和2种国内典型生物医学本体,比较并分析了它们的成功经验,为本体复用奠定基础。第二部分,军事医学本体构建的理论探讨。首先比较了通用顶层本体、一般医学本体和军事医学本体之间的关系,理清了军事医学本体构建的相关概念。然后阐述了军事医学本体构建的必要性,并详细分析了目前军事医学术语标准的现状,对比分析了4类术语标准,总结了其存在的问题。最后从军事医学学科知识复杂性、军事医学概念复杂性、概念之间语义关系复杂性叁方面剖析了军事医学本体构建的难点问题。第叁部分,军事医学本体构建的方法研究。首先通过对军事医学知识特点的分析,阐述了军事医学本体构建需要遵循的原则,指出了其必须满足本体构建的一般性原则、医学本体构建的通则以及军事医学本体构建的特殊性原则。然后探讨了军事医学本体的构建方法,从军事医学知识组织的实际出发,提出了军事医学本体构建需要采用的方法主要包括本体论方法、文献计量法、语义分析法和专家调查法。第四部分,军事医学本体构建的示范研究。本部分在军事医学本体构建的理论和方法研究基础上,以军事医学顶层本体构建为实例,设计并构建了军事医学顶层本体模型框架及概念间的语义关系。首先提出了军事医学顶层本体构建的步骤,包括确定研究的领域和范围、复用现有本体、核心概念集的选取、建立顶层本体模型框架、定义顶层框架的语义关系、顶层本体框架的公理表示6个步骤。然后复用了UMLS语义网络。选取了《军用医学主题词表》族首词、军事医学文献关键词作为军事医学核心概念集,设计了军事医学顶层模型框架的语义类型及其上下级逻辑关系。在继承了UMLS全部56种语义关系的基础上,选取了军队卫生装备学和防原医学两个子学科对军事医学顶层本体语义关系的建立进行了示范。选取了军事医学论着、军事医学文献作为两个子学科顶层语义关系建立的文本集,通过文本分析提取了其中包含的概念间关系,以此建立了军事医学特有的语义关系。最后从军事医学顶层框架的合理性和语义关系的适用性两方面,对军事医学顶层本体构建的结果采用两种方法分别进行了评价。一是采用了基于数据驱动的方法,验证了军事医学顶层本体模型框架是否覆盖了全部实验数据,同时也补充了顶层模型框架包含的概念种类及语义类型之间的语义关系。二是采用了专家调查法对军事医学本体构建的方法及顶层本体构建的结果进行了评价,并依据专家意见修正了部分顶层本体模型框架。

鲍玉来[4]2018年在《基于领域本体的蒙医药学知识库构建与知识发现研究》文中研究表明我们已经从信息时代走进了“数据驱动”的“智慧时代”,数据的资源化已成为知识服务重要发展方向。对信息资源语义化和深度挖掘的需求,将提供焦点问题发现、为信息找用户相交的发现性服务也将是知识服务的又一趋向,基于用户的特定需求,对信息资源中的隐含信息进行智能提取,将转换的可理解、可利用的信息提供给用户,协助用户进行问题分析与处理。随着语义网概念的提出,具有语义描述能力的本体技术获得了广泛关注。本体技术是一种常用的语义网络知识表示方法,其设计理念是将领域知识表示为带标签的图,其中节点表示领域概念,边表示概念之间的语义关系。语义网络因其简单、灵活、丰富、易读等优点,在计算语言学、生物学、医学等诸多领域得到广泛应用。WordNet、UMLS、SNOMED CT等大型术语系统都体现了语义网的基本思想。应用本体技术描述和揭示蒙医药学基础理论、疾病、症状、症候、方剂、药材、药性、药味、诊疗方法等资源之间的语义关系,构建知识库,是实现蒙医药学资源语义检索、语义推理和知识发现的有效途径。本文选择重要的蒙医药学文献,其中包括权威工具书、蒙汉文古籍、现代图书、期刊论文、学位论文等数据源,建立蒙医药学基础数字文本集。根据蒙医药学的特点,参照国际标准中医药学语言系统语义网络框架(ISO/TS17938:Semantic Network Framework of Traditional Chinese Medicine Language System,下简写为TCMLS-SN),探索建立蒙汉双语的蒙医药学概念语义分类层次模型和语义关系模型。根据语义模型提出了一种词向量包(Word Embedding)的语义标注算法进行基础数字文本集蒙医药概念的分类标注,建立蒙医药学基础概念库,并在此基础上构建蒙医药学领域本体,开发蒙医药知识库原型系统。主要研究包括:(1)蒙医药文献预处理根据领域专家的推荐选择蒙医药学重要的古籍、现代论着、权威工具书、期刊论文、学位论文为数据源。利用内蒙古大学图书馆建立的蒙古文古籍数据库、蒙古文现代图书数据库和中国基本古籍库等全文数据库收集数据源的数字文本。对无法获取数字文本的印本文献进行扫描OCR识别、校对,建立基础数字文本集。(2)蒙医药领域概念体系模型蒙医药学有着自己独特的理论体系。蒙医药学以阴阳五行、五元学说理论为指导,贯穿了人与自然的整体观。蒙医学把“五行”(或五元)凝练为“叁因学说”,即赫依、希拉和巴达根。“叁因学说”是蒙医学的理论基础,用来阐释一切生命活动、病理过程,指导着诊断与治疗的实践。结合蒙医药理论和实践特点,参照TCMLS-SN,从语义层面上对蒙医药领域概念进行分类,定义蒙医药领域概念语义类型(Semantic Type)和语义关系(Semantic Relation)。定义蒙医药语义类型,其来源包括:(1)蒙医药领域的特色概念,如“叁根”、“七素”、“六基症”“黑脉”、“白脉”“放血疗法”等;(2)与中医药领域的概念等同概念,如“脏腑”“腧穴”等;(3)通用概念,如“症状”、“症候”、“病因”、“病机”、“药用物质”等。在最顶层分为“实体(Entity)”和“事件(Events)”两大类,并由此展开其层次结构,形成蒙医药领域概念语义模型。(3)蒙医药学文本挖掘应用中科院信息研究所的NLPIR汉语分词系统和内蒙古大学模式识别与人工智能实验室的蒙古文分词系统对数字文本进行分词处理,分割出基础词汇,建立基础词库,在基础词库基础上,本文提出了一种基于词向量包的方法进行词汇的分类和语义标注,生成蒙医药基础概念集。(1)词向量生成。根据上节定义的蒙医药学语义类型及语义关系集,将分词得到的基础词库中词汇识别分类为上述语义类别和语义关系集中的一种或多种,即把文本中的所有词汇标注一种或多种语义类型或语义关系标签。采用词向量技术来表示文本中的名词语义概念,并通过机器学习算法训练生成文本标注(分类)识别模型。(2)蒙医药学概念语义标注模型。词向量生成后,采用机器学习的经典分类模型k近邻(KNN)来实现概念的分类任务,即把每个语义名词分类为蒙医药学语义类型和语义关系集中的一种或多种标签。(3)蒙医药学领域概念集基础词库在经过分类和语义标注形成了蒙汉文双语的蒙医药基础语义概念集。课题将通过领域专家咨询法和《蒙古语语义信息词典》等工具对其进行优化,形成蒙医药学蒙、汉对照的语义概念词库。(4)基于概念格的蒙医药学领域本体构建在获得了蒙医药学基础语义概念词库后,构建蒙医药学领域本体的思路为:在语义概念词库的基础上依据骨架法的流程,明确本体构建的目的和范围;针对蒙医药域特点采用自顶向下的方法分析领域本体,然后参照蒙医药理论体系,通过领域专家的参与,建立起概念间的属性关系和实例添加;最后选择适当的形式化语言表示本体。(5)蒙医药领域概念语义检索与推理本体构建为语义推理建立了基础。课题将以蒙医药本体提供推理事实为的基础,利用SWRL(SemanticWebRuleLanguage)规则语言和Jess推理引擎来实现诊断推理和方剂推荐。例如:在蒙医药诊疗实践中,医生通过对病人观察、病人口述病情结合现在医学的一些检查化验结果来得知病人病情。病人的病情状态总结为蒙医的症状、脉象和舌象等。通过这几个概念来确定患者证候,针对证候开具药方。在蒙医领域本体中则涉及3个重要概念的类及其下位概念:症状(包括主要症状、次要症状、脉象、舌相);证候和方剂。(6)蒙医药学知识库构建将面向蒙医药临床诊疗、教育教学和科学研究等实际需求,进行蒙医药领域知识库的开发。在上述研究基础上,通过系统开发,将各类算法集成,实现基于领域专家干预的本体的演进和迭代。并在HP实验室Jena本体工具集基础上进行研究和开发,使其适合蒙医药领域本体的存储、查询与推理。知识库将涵盖所有蒙医药领域的语义类型,具有语义检索与推理、知识可视化呈现、诊断辅助、误诊提示等功能实现领域文献到领域知识的转化。主要创新点如下:本论文创新点主要有以下叁个方面:(1)基于文献数据挖掘定义蒙医药学领域语义概念集,采用形式背景分析的理念构建蒙医药学领域本体语义系统本文根据蒙医药理论体系特点,在语义层面上对蒙医药领域概念进行语义类型和语义关系集的定义。并通过文献数据挖掘,将领域概念进行分类标注,构建蒙医药领域语义概念集。在此基础上,采用形式背景分析的理念构建蒙医药学领域领域本体语义系统,该语义系统既可充分揭示蒙医药学领域概念间的语义关系,同时在一定程度上消除不同文献典籍中概念不规范、不统一而产生的概念歧义。(2)基于等同语义的蒙汉双语本体构建实现蒙汉概念的语义互联本文根据OWL的语义定义规则,提出等同语义的双语构建模型。模型定义包括等同类、等同对象属性、等同数据属性、等同个体4个等同语义形式。通过对本文第叁章所获得的蒙医药领域概念的层次结构建立相应的类Class、子类subClass和个体Individuals。通过对类和子类的Equivalent class的属性和个体的Same Equivalent class As的属性控制,实现蒙汉概念的语义互联。(3)设计和开发蒙医药学知识库的原型系统,实现蒙医药学知识库的语义检索与知识发现面向蒙医药学领域临床诊疗、教育教学和科学研究等实际需求,设计和开发蒙医药学领域知识库原型系统,利用Jena推理引擎实现诊断推理和方剂推荐。

滕广青[5]2012年在《基于概念格的数字图书馆知识组织研究》文中进行了进一步梳理20世纪90年代以来,随着计算机和网络技术的发展,图书馆的概念逐渐超越了人们传统意识当中那幢钢筋水泥的建筑物。以数字化存储与呈现、网络化检索与获取为特征的数字图书馆,成为网络数字时代集知识存储、获取、传播、交流等多功能为一体的知识集散中心。数字图书馆的相关研究日渐成为现代图书情报学的重要分支,并在多学科理论与技术的支撑下获得了相对独立的发展空间与地位。这一期间,学术界对数字图书馆的理论探索和实践开展掀起了研究的热潮,特别是在针对数字化馆藏资源的建设方面取得了不菲的成绩。然而,随着近年来Web2.0的兴起及语义网络的发展,开放式语义网络环境下的数字图书馆知识管理面临着许多新的问题与挑战,其中数字图书馆的知识组织是这些问题当中最为基础而且突出的核心焦点。如何把握数字图书馆知识组织的基本脉络和发展方向,融合多学科的理论与技术,通过准确分析和深入研究探寻语义网络环境下的数字图书馆知识组织的内在机理与演变规律,构建开放式语义网络环境下数字图书馆知识组织的理论框架与发展蓝图,促进中国数字化知识产业的快速成长与发展,已成为一项亟待解决的重大课题。有鉴于此,论文以国际数据分析领域中在概念化知识处理方面最新的研究成果——形式概念分析(FCA)与概念格(CL)理论为基础,从知识的概念化、语义化、形式化的视角,对数字图书馆知识组织展开研究。致力于基于形式概念分析的概念格理论与技术构建数字图书馆知识组织的模型框架,创新数字图书馆知识组织的技术策略,推进数字图书馆在开放式语义网络环境下的实践进程。具体研究包括:(1)从国内外形式概念分析与概念格理论在概念化知识处理领域的应用和数字图书馆知识组织相关理论研究进展的文献调研入手,基于调研资料进行细致的梳理和分析。重点探讨了基于形式概念分析的概念格理论与技术在数字图书馆各类知识组织与服务中的应用,总结出适合本项目的核心理论、必备方法和关键技术。并通过对知识组织体系演进路径的分析,探讨了当前数字图书馆知识组织的困境与发展趋势,明确界定了论文的研究思路与逻辑起点。(2)通过对基于概念格的数字图书馆用户知识组织的研究,从数字图书馆用户内隐知识挖掘与萃取的层面,探讨了将形式概念分析与概念格理论应用于数字图书馆知识组织中用户知识需求识别、概念认知分析、行为偏好挖掘等方面的功能与优势。并进一步将这种优势延伸到数字图书馆新兴的社群分类法(Folksonomy)和开放存取(Open Access)领域,阐述了形式概念分析与概念格相关理论与技术对开放式、分布式语义网络环境下的数字图书馆知识组织活动的理论支撑与技术保障,论证了基于形式概念分析的概念格理论与技术应用于数字图书馆知识组织的科学性和有效性。(3)构建了相关领域知识的概念格。针对数字图书馆特定领域内的相关知识(包括内隐知识与外显知识),进行知识的语义化、概念化研究。依据知识概念的对象与属性创建形式背景,采用形式概念分析的技术构建领域知识概念格,实现领域知识的概念化、形式化描述。并基于领域知识概念格对特定领域的相关知识结构进行分析和呈现,揭示了知识之间的层级结构与关联关系,挖掘发现潜在的隐含规则与模式。(4)提出了“本体与概念格互补融合”的数字图书馆知识组织的技术策略。从哲学到图书情报学、从认识论到本体论、从内隐知识到外显知识,结合开放式语义网络发展的实际,对数字图书馆知识组织的理论与基于形式概念分析的概念格理论进行了全面、系统、深入的分析与研究。并基于以上研究提出了“本体概念格”互补融合的数字图书馆知识组织的技术策略。(5)基于概念格实现了领域知识本体的构建。针对数字图书馆中主题词表与文本两大主要类型的知识资源进行分析,借助概念格的并迭置运算构建数字图书馆异构资源概念格。通过领域知识概念格与领域本体之间的映射规则,在领域知识概念格的基础上构建领域本体。基于概念格的本体构建,提高了本体构建的形式化、自动化程度,大大降低了人为的干扰因素,实现了“概念格本体”的正向促进。(6)建立了基于概念格的跨本体映射。对相关领域本体进行基于概念格的逆向解析,将标准词典中的相关同义词、上位词等关系嵌入本体中的知识概念及层级结构,将不同的异构本体转换为相应的概念格,并提取有效的知识概念。进而基于概念的属性与对象,创造性地提出了基于概念格的“对象-属性相似度(OAS)”法。利用该方法对通过逆向解析获得的概念进行相似度计算,并根据设定的阈值提取满足阈值要求的异构本体间的相似“概念对”,基于相似“概念对”建立了跨异构本体的映射关系,完成了“本体概念格”的逆向解析。(7)构建了基于概念格的多本体协同知识地图。从哲学与情报学角度对人类知识的应然状态与实然表现进行系统的分析与总结,对当前知识的本体化进程与作为知识组织终极表现的知识地图进行系统的分析与论述,为构建基于概念格的多本体协同系统奠定理论基础。选取现实中特定领域范围内典型的、具有代表性的成熟领域本体,基于概念格建立跨本体映射,并据此构建多本体协同知识地图,以“拼图”形式实现了更大范围的知识组织。论文基于形式概念分析与概念格相关理论与技术,以解决开放式、分布式语义网络环境下数字图书馆知识组织相关问题为逻辑起点,在梳理、总结形式概念分析与概念格在相关领域中的应用的基础上,对知识组织及其体系结构的演进进行了分析与归纳,综合运用知识组织理论、本体理论、概念格理论、语义学理论,全面、深入、系统地研究探索数字图书馆知识组织的技术策略和框架模型。构建了相关领域知识概念格,提出了本体与概念格互补融合的数字图书馆知识组织技术策略,并据此实现了数字图书馆异构资源领域本体构建和跨本体映射,并在此基础上构建了多本体协同知识地图。论文的理论价值在于,丰富和完善了数字图书馆知识组织的理论体系与方法体系,促进现代语义网络环境中数字图书馆知识组织理论与方法的变革。对用户内隐知识的挖掘与发现是数字图书馆知识组织理论新的生长点,本体与概念格互补融合为知识描述、知识组织、知识导航、知识构建提供了新的理论支撑和解决方案。论文的现实意义在于,柔性化的数字图书馆知识组织体系是当前语义网络环境下数字图书馆实践的现实需求,基于概念格的数字图书馆知识组织,通过构建多本体知识地图,概念化、语义化、形式化地呈现和揭示知识结构与关联,提高数字图书馆用户知识获取与利用的效率,更好地释放和发挥数字图书馆在现代语义网络环境中的潜能和价值。

常艳[6]2008年在《基于本体的数字图书馆知识组织构建模式研究》文中提出20世纪90年代以来,本体被广泛应用于人工智能、知识工程等领域。作为一种能在语义和知识层次上描述概念体系的有效工具,本体也引起了图书情报界的极大关注。基于本体的数字图书馆知识组织构建模式研究为知识组织在语义层面上打开了一个崭新的空间,为实现信息服务的语义化和智能化奠定了基础。首先,本文介绍了数字图书馆知识组织的内涵及原则,并对现有的知识组织模式做以介绍,找出它们在数字图书馆知识组织中的不足,并提出了基于本体的知识组织模式。其次,本文介绍了本体的概念、分类、功能、特点及本体的形式化模型,分析了本体进行数字图书馆知识组织的原理及作用,并将本体的知识组织模式与现有知识组织模式进行了比较分析。最后,本文列举了常见的本体描述语言,详细介绍了OWL语言,同时介绍了目前主要的本体构建方法和工具,并对本体构建方法进行了比较分析。通过上述研究,并结合现有的本体构建方法及软件工程方法,本文构建了基于本体的数字图书馆知识组织模式,详细阐述了本体构建的过程;并以构建苹果病虫害领域本体的例子进行实例分析。

刘健[7]2017年在《数字图书馆资源聚合与服务推荐研究》文中进行了进一步梳理大数据环境下,以数字化存储与呈现、网络化检索与获取为特征的数字图书馆,成为集用户获取知识、传播知识、交流等多功能为一体的知识集散中心。各种数字对象(知识作为一种对象,可以表现为各种文献、事实/科研数据、数据库、知识库和知识体系)构成了可充分集成关联的数字图书馆领域的大数据环境,数字图书馆资源规模化增长是不可逆转的客观事实。随着数字图书馆资源的迅猛增加,以及智能技术的普及,推荐服务的智能化和个性化已经成为服务推荐发展的趋势。然而传统的个性化服务已经无法满足用户需求以及数字图书馆的发展。一方面,用户需求越来越复杂,如何准确描述和充分挖掘用户的个性化复杂需求,根据用户需求向其进行资源服务推荐成为难题;另一方面,数字图书馆资源数量巨大,如何有效对海量资源聚合并支持高效检索和推荐,充分挖掘数字图书馆资源内在的语义联系成为关注重点。数字图书馆资源"聚合"旨在发现资源之间及其内在的语义关联,通过系统汇聚、挖掘利用、有效整合多源异构的数字图书馆资源,构建一个内容相互关联、多维度、多层次的资源体系,形成集概念主题、学科内容和科研对象为一体的立体化知识网络;服务推荐作为一种有效的智能化信息过滤技术,能够结合数字图书馆资源的内容特征,通过对用户的兴趣偏好和资源访问行为进行自动分析与挖掘,主动向用户推荐满足其需求的数字图书馆资源。可见,基于数字图书馆资源聚合实现服务推荐已成为满足用户精准化需求的重要途径。本文以领域本体、数据挖掘、复杂网络理论及分析方法等技术和方法为基础,借鉴相应聚合及个性化推荐的成果,提出了面向用户复杂需求的资源聚合方法与服务推荐技术,为数字图书馆资源服务推荐提供相应参考。主要研究内容如下:(1)界定了数字图书馆资源聚合及服务推荐概念,分析了数字图书馆资源聚合同服务推荐之间的关系。数字图书馆资源聚合是服务推荐的基础,服务推荐是数字图书馆资源聚合的目标。服务推荐又从用户需求方面引导聚合的质量,更进一步揭示了学科领域的知识结构与发展规律,从而能够在提高数字图书馆资源聚合能力和效率基础上满足用户个性化需求、提升服务推荐效果。(2)阐述了数字图书馆资源语义化概念,分析了数字图书馆资源语义化、语义关系以及数字图书馆资源的文本语义距离。语义概念和语义关系构成了数字图书馆资源聚合的基础,将领域本体看做由节点(语义概念)和弧线链(语义关系)组成的带有标记的有向网络。基于复杂网络理论对其进行分析,深度揭示概念之间的网络关系,进而挖掘、建立、利用资源之间的联系,将繁杂、无序的内容通过聚合以呈现关联性。(3)对数字图书馆资源聚合的特征、维度等问题进行系统研究,综合运用复杂网络理论及其指标、语义相似度计算等理论方法和工具,构建了数字图书馆资源聚合模型。总结了数字图书馆资源聚合的特征:数字图书馆资源聚合对象的多元化、数字图书馆资源聚合方法的多样化、数字图书馆资源聚合维度的立体化以及数字图书馆资源聚合过程的动态化。在此基础上,提出了数字图书馆资源聚合模型。该模型框架包括数据资源层、资源语义化层、资源聚合层、应用层四个层次,即从数字图书馆资源甄选及资源语义化(微观)到资源的系统汇聚(中观)再到资源的深度挖掘与利用(宏观)。(4)分析了基于维基百科构建的领域本体的网络结构,结合复杂网络指标中的度、集聚系数等指标测度提出了重要节点识别方法,以此作为聚合的基础。依据D-S证据理论,在识别框架(high,low)下构建基本概率分配函数,表示节点重要性程度,通过D-S证据理论合成公式进行合并,以概率的形式对节点重要性进行量化,并得到节点重要性的评价指标。对构建的领域本体进行分析,发掘网络的重要节点,能够为充分挖掘本体的语义信息、发现本体中的隐含知识、对特定领域的相关知识结构进行分析和呈现、解决领域知识共享等问题提供方法和参考。(5)通过改进基于本体的语义相似度计算方法以及基于《同义词词林扩展版》的语义相似度计算方法,提出了改进的谱聚类算法。在资源聚合中应用文本聚类分析的方法,从资源内部以及外部特征出发,利用资源聚合原理使资源呈现出集簇状,进而根据资源呈现出的层次簇状结构为之选择一种或多种合适的表示结构,从而深入地挖掘出隐含在资源之间的语义关系。(6)提出了 3种服务推荐方法:基于本体规则推理和语义相似度计算的服务推荐方法、基于关联语义链的服务推荐方法、基于谱聚类的服务推荐方法。通过对数字图书馆资源有效聚合,将资源语义化并进行语义关联,在此基础上,挖掘用户需求信息,根据用户偏好对其进行推荐。实验结果表明:在对数字图书馆资源聚合的基础上利用服务推荐方法对用户进行推荐,可以提高推荐准确性,使得推荐结果更加符合用户对于数字图书馆资源的偏好。利用本体、数据挖掘以及服务推荐等方法,对数字图书馆资源聚合以及服务推荐进行研究,为资源聚合与服务推荐的深入研究搭建了一个新的框架,从而为优化其资源再组织结构和提升知识服务能力提供有价值的参考与指导。(7)将知网文献资源作为数据源,验证了本文第4章和第5章所提出的聚合和推荐方法,从技术实现的角度采用JAVA语言和MYSQL数据库开发设计了数字图书馆资源服务推荐应用平台。该系统采用C/S系统架构,集成了本文所提出的聚合方法和推荐方法,实现了数字图书馆资源聚合及服务推荐功能。以聚合为基础为用户进行服务推荐的方法解决了传统推荐方法对用户需求挖掘不充分、冷启动以及数据稀疏等问题,实现了推荐结果与用户个性化需求的高度匹配,并提高了推荐精度,进一步扩展了数字图书馆未来开展知识服务的新视野。

牟冬梅[8]2005年在《本体在医学数字信息资源知识组织中的应用研究》文中认为医学数字信息资源的特殊性为知识组织增加了难度,需要不断创新知识组织工具,提高获取知识的效能。本体的应用研究必然改善这一特定领域的知识服务水平。研究者在分析国内外医学领域本体研究现状的基础上,立足医学数字信息资源知识组织,分析了信息组织与知识组织的特点,比较了7 种不同知识组织工具,并对医学领域本体、医学主题词表、统一医学语言系统语义网络的区别和联系进行深入探讨,提出领域本体(医学)构建应利用医学主题词表对于概念的规范表达、语义网络对语义类型的网状结构组织和本体中的函数、公理等要素提供的推理功能。最后构建中文肝炎本体模型,由浅入深地研究本体的应用原理、机制、途径和方法,揭示本体如何在特定领域数字信息资源知识组织中应用和发挥的作用。

陈果[9]2015年在《基于领域概念关联的网络社区知识聚合研究》文中指出本文从网络社区用户知识交流特征出发,提出一种用户需求的知识聚合方案。网络社区知识组织的主要依据是用户交流内容中的主题及其对应的领域概念关联。因此网络社区知识聚合的核心是构建面向特定领域的概念关联体系。传统知识组织体系不能很好地满足网络社区中的知识聚合需求,因此本文研究的重点为通过融合已有的领域背景知识体系和基于UGC内容挖掘生成的知识关联体系,构建领域多元概念关联体系;以此为支撑实现面向网络社区的多维知识聚合。第一章研究网络社区知识聚合的模式问题。首先,在分析网络社区用户交流特征的基础上讨论了其知识聚合需求,在回顾网络社区知识聚合发展路径的基础上,重点探讨了概念知识关联的特征与形式,以此为基础提出了网络社区知识聚合的模式。第二章以领域知识分析为视角,讨论基于领域概念关联的网络社区知识聚合模型构建问题。在引入领域知识分析视角的基础上,进一步讨论了以领域知识为背景的领域概念关联的特征,及其在知识组织中的作用机制。在此基础上,提出了包括领域多元概念关联体系构建流程和基于概念关联的网络社区知识聚合实现方案在内的总体模型。第叁章研究领域结构化概念关联体系的构建。通用性和专业性的结构化知识组织体系(分类法、主题词表、本体、主题图等)为构建面向特定领域的结构化概念关联体系提供了基础,因此从已有的结构化概念关联体系中提取领域概念单元、合并概念关联是最直接的方案。另一方面,大多数领域都缺乏可利用的有针对性的结构化知识组织体系,因此从其他资源途径获取领域概念单元和概念关联有其必要性。本文讨论了基于用户用词领域概念单元抽取、基于资源内容挖掘的领域概念单元抽取、基于资源挖掘的领域概念关联识别等问题;并进一步阐述了如何将这些从其他资源途径获取的领域概念关联体系基本元素与已有的概念关联体系进行合并,包括概念映射和标准化、概念关联合并等问题。领域结构化概念关联体系的形式化是后续知识利用的基础,通过对比SKOS和OWL 2两种语言对概念关联体系的表述细节,本文选定基于OWL 2语言的领域结构化概念关联体系形式化方案。为了检验上述思考和方案的有效性,本文开展了基于主题词表和百科内容挖掘的心血管领域结构化概念关联体系构建实验。第四章研究领域共现型概念关联体系的构建,其思路是从网络社区用户交流内容中挖掘概念关联。文本图模型为概念单元在用户交流内容中的共现关系表示提供了理论基础,通过探讨基于文本图模型的领域概念共现网络构建流程,本文将领域共现型概念关联体系划分为两大阶段。其一是由用户交流文本集向概念共现关系矩阵转化,核心步骤包括文本集构建、中文切分词与同义词合并、领域术语识别、概念共现关系提取与共现矩阵构建;其二是概念共现关系矩阵向概念共现网络的转化,核心步骤包括概念共现关系强度的标准化、概念相似度计算、基于相似度的概念关联边强度映射和概念共现网络生成。根据上述思路和方案,本文以着名的医学社区丁香园为例,选定其中影响力较大的心血管论坛作为对象,构建了基于用户交流内容挖掘的心血管领域共现型概念关联体系。第五章研究领域多元概念关联体系的融合。本部分研究开展的前提是探讨结构化概念关联体系和共现型概念关联体系融合的机理,在对两者优劣势分析的基础上可提出基于优势互补的融合原则,并制定将结构化概念关联体系中的概念内涵、概念和关联类型、层次组织结构赋予共现型概念关联体系的融合方案。融合方案的实现主要体现为体系间元素映射,包括概念术语映射和语义关系映射,在语义映射部分重点探讨了语义相似度融合方案和细粒度关系发现两个问题。此后,通过对多元概念关联体系融合后的数据关系进行梳理,确立了基于关系数据模型的多元概念关联体系形式化方案。在实验部分,对前文已构建的心血管领域结构化概念关联体系和共现型概念关联体系进行了融合。第六章研究基于多元概念关联体系的网络社区知识聚合实现问题。在探讨了多元概念关联体系对网络社区知识聚合作用机制的基础上,本部分提出了以知识单元粒度和知识聚合形式为维度的多维知识聚合模式。此后,分别对不同知识单元粒度的知识类聚和知识共聚方案和实现方法进行了探讨。知识共聚方案是本文有别于传统知识聚合形式的创新点,以概念单元的多维度和细粒度关联为支撑,可实现网络社区分面检索与导航、主题多维推荐、知识元链接体系构建和资源关联发现等功能。在实验部分,专门针对丁香园心血管论坛的知识聚合方案实现进行了实验。

万毅[10]2009年在《循证医学证据评价的语义模型与应用研究》文中研究说明随着信息化的发展,循证医学证据资源产生、评价与利用的标准化、规范化越来越备受重视。如何为广大临床实践工作者提供便捷高效的医学证据支持,促进循证医学证据信息的评价、利用和资源共享是循证医学实践的关键环节和有待解决的问题。对于医学研究证据信息资源来说,利用本体可以提供一种智能化的检索机制,可以突破传统信息检索技术的弊端,真正满足用户的信息需求和表达习惯,增强检索系统的处理能力,在减轻终端检索用户认知负担的同时,把循证医学证据评价信息从基于关键词的层面提升到基于概念或知识的层面,提高循证医学证据及评价的信息检索和利用,最终实现“智能化”的证据评价信息检索和利用。本文综合运用了文献调查分析、网络信息检索与比较、案例分析、综合归纳、专家访谈等多种研究方法,以不同类型医学研究证据信息资源为实例,对基于本体的知识组织这一课题进行了深入的研究,运用图书馆学、情报学的相关知识,以为用户服务的角度出发,构建具有循证医学特色的基于本体的证据评价知识组织研究体系模型框架。研究通过构建循证医学证据评价的语义模型,研究医学证据评价知识表示方式。在循证医学证据评价基本要求的指导下,应用本体工程原理,对医学证据评价相关项目进行全面的知识体系分析,整理和收集相关的资料信息,并对它们之间的关系进行分析,建立循证医学证据评价的语义模型和系统评价实例,并通过系统评价及相关研究实例对模型的适用性进行初步测试和评价。本研究为循证医学证据评价提供了知识表示的一种规范形式,对广大医学工作者和对医学感兴趣的用户提供了循证医学全面而专业化的证据资源评价描述信息。在模型的知识体系构建中,本研究从医学证据评价的各个关键环节对证据质量和现状进行了全面的分析,同时参考国际通用规范和标准等资料,从研究证据的来源、类型、结构、相关性、科学性和可靠性等各方面确定了不同研究设计类型的医学研究证据评价的知识体系,并以此为基础构建循证医学证据评价的语义模型。知识本体的建立以公认的循证医学证据评价理论为依据,遵循本体开发的基本原则和斯坦福大学医学院本体开发的七步法,采用知识本体编辑工具Protégé构建语义模型的层级结构,定义概念与概念之间的关系以及语义槽的专业词汇和其他元数据的规范描述。医学证据评价本体收纳了常用的证据评价相关指标和项目,并通过对各项指标和项目的应用环境的描述,建立了指标概念之间的逻辑关系。本研究构建了包含证据评价基本要素的语义模型,创建了7个类、27个子类和87个语义槽(属性)和元数据,并实现了模型的结构化和形式化表达。该模型根据不同的研究设计类型又分为以下几个部分:系统评价与Meta分析评估(QUORUM)语义模型;随机对照试验质量评估(CONSORT)语义模型;观察性研究(STROBE)评价语义模型;诊断试验(STARD)标准语义模型;临床指南(AGREE)评估语义模型等。研究还通过系统评价实例的创建对模型重用和完善,同时为临床实践提供了有效证据。系统评价实例以房颤患者抗凝控制指标的选择及其与不良事件的关系为研究问题,具有重要的临床实践意义。研究检索MEDLINE,EMBASE和Cochrane Library截至2008年关于房颤患者口服抗凝剂治疗研究中,报告抗凝控制指标的文献。相关指标包括:在抗凝目标值范围内的时间百分比(percentage of time in therapeutic range,TTR),在抗凝目标值范围内的国际标准化比值百分比(percentage of INRs in range)和临床不良事件(主要有严重出血和血栓栓塞事件)发生率等。从检索到的全部1571篇文献中,根据纳入、排除标准和语义模型证据质量评价结果,入选文献38篇,共计47个研究组。为了使抗凝控制收益最大化,患者需要定期监测和合理调整抗凝治疗以保持国际标准化比值(INR)位于参考值范围之内。结果显示,TTR仅增加7%就可以使严重出血下降1例每百人年。基于本研究的分析结果,抗凝治疗要达到收益的最大化和有效降低不良事件发生率,最好使TTR达到70%~80%的目标。在口服抗凝剂治疗的房颤患者中,TTR和抗凝目标值范围内的INR百分比能有效反映抗凝控制质量。提高TTR和抗凝目标值范围内的INR百分比水平能有效降低严重出血和血栓栓塞不良事件发生率。系统评价实例的研究过程和结果为循证医学证据评价语义模型的改善和适用性评估提供了良好的环境。通过系统评价及相关不同研究类型实例的模型重用,本研究调整和完善了模型的结构和属性,验证了模型的清晰一致性和适用性;同时,为系统评价实例研究过程提供了医学文献证据质量评价的形式化表达和结果推论的参考。本研究循证医学证据评价语义模型的开发过程均根据相应的国际上通用的研究标准或规范来构建,结合实例来完善和评估,具有权威性、清晰性、一致性和适用性;同时,模型设计过程中考虑到了将来修订和发展的需要,设定了相应的类、语义槽和元数据,使模型具有可扩展性能。本研究还对本体技术在循证医学证据评价的知识运用与表达上和在与系统的交互性上进行了实验性的探索。虽然没有达到检索的智能推理,但研究基于医学研究证据评价本体的概念检索,能提供以循证医学证据评价内在联系为基础的检索,提高检索的全面程度,同时通过对检索结果的适当交互控制,提高准确程度。研究结果促进了循证医学证据评价的信息化和循证医学临床实践的开展。综上所述,建立通用的循证医学证据评价的语义模型和基于该模型的各种研究设计证据评价模型,对于医学研究证据信息资源的有效管理和开发利用,对于循证医学从临床问题、证据开发与评价到临床实践应用的转化具有重要意义。

参考文献:

[1]. 网络环境下基于ontology的医学知识组织研究[D]. 冯璐. 黑龙江大学. 2004

[2]. 政府网站信息资源多维语义知识融合研究[D]. 黄新平. 吉林大学. 2017

[3]. 军事医学本体构建的理论与方法研究[D]. 肖健. 中国人民解放军军事医学科学院. 2016

[4]. 基于领域本体的蒙医药学知识库构建与知识发现研究[D]. 鲍玉来. 吉林大学. 2018

[5]. 基于概念格的数字图书馆知识组织研究[D]. 滕广青. 吉林大学. 2012

[6]. 基于本体的数字图书馆知识组织构建模式研究[D]. 常艳. 吉林大学. 2008

[7]. 数字图书馆资源聚合与服务推荐研究[D]. 刘健. 吉林大学. 2017

[8]. 本体在医学数字信息资源知识组织中的应用研究[D]. 牟冬梅. 吉林大学. 2005

[9]. 基于领域概念关联的网络社区知识聚合研究[D]. 陈果. 武汉大学. 2015

[10]. 循证医学证据评价的语义模型与应用研究[D]. 万毅. 第四军医大学. 2009

标签:;  ;  ;  ;  ;  ;  ;  ;  

网络环境下基于ontology的医学知识组织研究
下载Doc文档

猜你喜欢