导读:本文包含了半自动构建论文开题报告文献综述及选题提纲参考文献,主要关键词:知识图谱,本体,语义映射,Neo4j图数据库
半自动构建论文文献综述
胡欢,云红艳,贺英,张秀华[1](2019)在《半自动构建扶贫领域知识图谱工具的研究》一文中研究指出目前针对扶贫领域的知识图谱构建比较匮乏。论文是基于重庆扶贫领域内的数据源,构建一套半自动化生成知识图谱的工具。首先,自动生成LOAD语句导入Neo4j图数据库。其次,根据本体定义的规则与重庆扶贫数据源中的不同数据类之间进行语义映射。基于语义映射得到的结果,自动生成MATCH语句导入图数据库。最后,输入关键字,通过Echarts组件实现按人物、关系查询的图谱检索功能。用户和开发者可以通过功能丰富的应用界面,方便和透明地使用和维护知识图谱,对扶贫相关部门基础数据的应用和公开具有重要意义。(本文来源于《计算机与数字工程》期刊2019年08期)
段帅阳[2](2019)在《初等数学问题知识图谱的半自动构建技术研究及实现》一文中研究指出随着互联网进入一个高速发展期,人们的衣、食、住、行等各个方面都发生了日新月异的变化,教育行业也逐步从传统的机械化教育方式到现代的智能化教育方式转变。知识图谱是大数据时代的产物,不仅可以方便的查看学科知识点的结构关系,而且可以为自然语言理解提供可视化的概念——关系表示及深度语义推理。因此,构建初等数学知识图谱,引导学生自主学习、充分发挥主观能动性具有重要的理论意义和实际应用价值。本文在研究分析初等数学学科知识特点的基础上,提出了一种基于核心概念和关系的初等数学知识图谱半自动构建方法,主要研究内容如下:通过对通用领域自然语言处理和知识表示方法的分析和研究,提出了面向数学领域的自然语言处理模型和知识表示方法。按照数学知识使用场景的不同,把数学学科知识分为几何、代数、概率统计和文字题四大类,使用支持向量机实现初等数学问题的场景分类,降低了关系抽取任务的复杂度,便于知识点的模块化管理。使用模式匹配、句法分析和深度学习方法进行关系抽取,同时融合依存句法分析和TextRank算法,提出了一种基于关键词定位的初等数学文本关系自动抽取方法,实现了基于核心概念和关系的初等数学知识图谱构建。手工构建的初等数学核心概念和关系663个,通过本文的方法自动抽取出856个实体和22578个叁元组关系,丰富和完善了初等数学知识图谱。最后使用构建的数学知识图谱辅助进行初等数学题意理解,通过对题意理解结果的分析表明,建立的知识图谱可以提高数学题意理解的通过率,具有较好的使用价值。(本文来源于《电子科技大学》期刊2019-03-22)
魏巍,傅维刚[3](2019)在《面向社交媒体的细粒度ADR本体的半自动构建方法研究》一文中研究指出[目的/意义]提出一个药物不良反应本体的半自动构建方法,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。[方法/过程]首先,采用业务层次和语言层次相分离的设计理念,将用户在社交媒体中评论的药物不良反应表示成"对象要素-属性要素-描述概念"的形式。细粒度体现在社交媒体用户对药物同一不良反应描述概念表达的多样性上。然后,基于深度学习的思想,利用基于word2vec的描述概念候选词抽取算法自动地抽取出更多的描述概念候选词构建本体。[结果/结论]以糖尿病药物的建模实例表明,提出的细粒度药物不良反应本体的半自动构建方案,提高了本体构建的智能化水平,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。(本文来源于《图书情报工作》期刊2019年03期)
库都来提·阿布都热合曼[4](2018)在《小语种领域本体半自动构建技术研究》一文中研究指出本体(Ontology)是一种能在语义和知识层次上描述领域相关问题的概念模型,是解决领域知识共享与重用的重要手段。作为数据高级组织结构的本体在知识工程、数字图书馆、信息检索和语义Web领域中都发挥着重要的作用。目前本体相关的研究中关于如何构建本体还没有一个确定准确的方法。为了规范化本体构建方法,本文通过对一些半自动领域本体构建方法的研究进行分析,提出了一种小语种领域本体半自动构建技术,以维吾尔语为例。在一些小语种语言研究中,比如在维吾尔语中对本体的构建的研究相对于英语和中文等应用范围广泛的语言相比少且落后。小语种中缺少辅助构建领域本体的一些外部资源,比如:较完整的虚词表、同义词近义词等词汇库或者类似于Wordnet的可以提供语义结构的资源。因此针对小语种中缺少外部辅助资源,提出一种基于跨语本体重用和领域文本概念提取的构建维吾尔语领域本体方法。为构建维吾尔语领域本体提供了极大的便利。本文提出的小语种领域本体半自动构建方法主要分为两个部分。一是构建标准的领域本体,其中包括收集跨语言重用本体、叁元组自动抽取、英语、维吾尔语匹配。再对构建的维吾尔语叁元组库进行修改、调整等步骤对其进行优化,最后通过Apache Jena工具构建维吾尔语标准领域本体。二是使用了一个从维吾尔语领域文本语料库扩充领域本体的方法。该方法,首先收集和准备语料库并进行删除停用词和词干提取等预处理操作。然后使用TFIDF算法从领域文本中提取领域核心词汇库。14种领域混合语料的词语向量模型的训练使用了谷歌开源的word2vec工具。并从中提取出与核心词汇语义相近的词构建扩充的领域词汇库。通过领域专家的验证和判断筛选出准确的语义相近的词汇,借助Protégé工具手工将这些词汇插入到标准领域本体中,实现对标准本体库中的概念词、属性和实体等的扩充工作。最后使用Protégé工具对构建的本体进行语法验证。通过对实验结果的分析和讨论,证明了本文中的方法是有效的,同时也验证了小语种领域本体半自动构建技术在维吾尔语领域本体构建中的中的可行性。(本文来源于《新疆大学》期刊2018-05-25)
郝嘉树[5](2016)在《基于关键词聚类的领域本体层次关系半自动构建研究》一文中研究指出由于本体在图书馆资源组织中作用日趋明显且手工构建复杂费时,自动构建成为研究热点,其中层次关系作为本体的基本骨架构建尤为重要。使用词聚类技术是本体层次关系构建另一途径和方法,目前国内相关研究少。选取学术期刊数据库中情报学领域标引的关键词基于词聚类技术半自动构建情报学本体层次关系,包括数据聚类前关键环节处理,选取适合数据分布的EM算法并多次聚类,描述、组织各类簇。最后与《中分表》情报学层次体系从深度、广度和实例叁个维度比较评价构建的层次关系。(本文来源于《情报科学》期刊2016年04期)
许超凡[6](2015)在《基于关系数据库的本体半自动构建系统的设计与实现》一文中研究指出在语义网中,本体(Ontology)具有十分重要的地位,它是解决语义层次上知识共享、重用和交换的基础。但是,目前大部分本体都依赖领域专家手工构建。手工构建本体存在自动化程度低、专家依赖性强、本体构建速度慢等缺陷,限制了语义网及其相关应用的发展。因此,如何半自动、自动化构建本体是语义网相关研究中的一个重要问题。本文做了如下工作:(1)提出一种基于关系数据库的OWL本体构建方法,主要思想是在本体和关系模式形式化定义的基础上,经过对关系模式信息进行详细分析,定义一系列从关系模式映射到本体的规则,依据这些映射规则,同时结合OWL语言的语法特点构建本体。解决了目前大部分本体都依赖领域专家手工编辑的问题。(2)研究基于概念相似度的本体集成方法。该方法首先计算本体中概念间的相似度,相似度的计算采用基于WordNet的语义相似度计算公式、基于编辑距离的相似度计算公式和基于本体属性的语境相似度计算公式,生成相似度矩阵。然后使用分层聚类算法找出相似概念。最后利用启发式规则进行相似概念合并。解决了分散、异构的本体合并和概念层次挖掘问题。(3)基于Spring MVC框架,采用B/S架构,利用开源的分布式图数据库bigdata®作为本体的存储介质,开发一个本体半自动构建系统。该系统实现关系数据清洗去重,本体实例数据半自动构建,海量本体数据存储,及查询浏览数据的功能,系统发布在网络上,拥有友好的用户界面,可以为各种与语义相关的服务(语义搜索,自动问答等)提供支撑,成为语义网上层应用的基石。(本文来源于《北京工业大学》期刊2015-06-01)
尹弼民[7](2015)在《基于概念格理论的领域本体半自动构建方法研究》一文中研究指出目前,大部分工程领域知识获取和数据管理、知识管理采用电子文档和数据库的形式,但容易造成数据应用价值低、共享性差等问题。解决这些问题的一种重要途径是构建领域本体。本文基于形式概念分析(Formal Concept Analysis),提出了一种领域本体的半自动构建模型——DOPOM。该方法在领域专家参与的程度与环节上作出了修改,并通过对有针对性的形式背景的合并来形成领域本体,提高了本体中概念和关系的准确率,且在工作中实现了领域本体的动态增长和逐步完善。概念格作为形式概念分析的核心数据结构,在本体知识领域,已经起到越来越重要的作用。目前,已经出现了诸多有效的概念格构造算法。本文给出了内涵相关度的定义,提出了一种根据内涵相关度择优选择合并模式的概念格构造方法。该方法能很好地适用于之前研究的DOPOM领域本体半自动构建模型。最后,通过实验对比证明,基于内涵相关度的概念格生成算法具备一定的可行性、完整性以及平衡最优性。(本文来源于《南昌大学》期刊2015-05-20)
傅彦,徐昭邦,夏虎,周俊临[8](2015)在《基于逆向匹配的电子商务网站实体模板半自动构建方法》一文中研究指出Web页面中的主题信息一般分布比较集中,可利用网页的这一特性进行网页主题信息的自动提取。网页源代码中的HTML标签不规范,使得正向匹配难以生成嵌套结构准确的DOM树,该文提出一种通过逆向匹配的方法,构建完整的网页源代码DOM树。通过对DOM树进行剪枝,删除无关节点,对保留下来的信息块的节点标签进行人工选择与唯一性判定,从而生成提取模板。该方法能够实现对电子商务网站源网页中的主题信息进行提取,是一种半自动、通用的方法,可用于信息检索系统中的信息采集。(本文来源于《中文信息学报》期刊2015年02期)
柔特[9](2014)在《基于WordNet的藏文语义词典半自动构建方法研究》一文中研究指出语义词典是人工智能、语义网与知识工程等研究领域的热点,它可以支持机器学习、自然语义理解、数据挖掘及机器翻译等技术。文章在藏语独特的文法理论研究基础上,利用对比英文和藏文词之间的语义关系、构建双语大型数据库和制定映射过程中词汇空缺等方法,构建了基于半自动匹配的藏文语义词典。本语义词典既兼容了国际通用的英文WordNet,又保留了藏语的特点,为藏文信息处理提供了重要的数据资源。(本文来源于《西藏大学学报(自然科学版)》期刊2014年01期)
华却才让,姜文斌,赵海兴,刘群[10](2013)在《基于词对依存分类的藏语树库半自动构建研究》一文中研究指出依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。(本文来源于《中文信息学报》期刊2013年05期)
半自动构建论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着互联网进入一个高速发展期,人们的衣、食、住、行等各个方面都发生了日新月异的变化,教育行业也逐步从传统的机械化教育方式到现代的智能化教育方式转变。知识图谱是大数据时代的产物,不仅可以方便的查看学科知识点的结构关系,而且可以为自然语言理解提供可视化的概念——关系表示及深度语义推理。因此,构建初等数学知识图谱,引导学生自主学习、充分发挥主观能动性具有重要的理论意义和实际应用价值。本文在研究分析初等数学学科知识特点的基础上,提出了一种基于核心概念和关系的初等数学知识图谱半自动构建方法,主要研究内容如下:通过对通用领域自然语言处理和知识表示方法的分析和研究,提出了面向数学领域的自然语言处理模型和知识表示方法。按照数学知识使用场景的不同,把数学学科知识分为几何、代数、概率统计和文字题四大类,使用支持向量机实现初等数学问题的场景分类,降低了关系抽取任务的复杂度,便于知识点的模块化管理。使用模式匹配、句法分析和深度学习方法进行关系抽取,同时融合依存句法分析和TextRank算法,提出了一种基于关键词定位的初等数学文本关系自动抽取方法,实现了基于核心概念和关系的初等数学知识图谱构建。手工构建的初等数学核心概念和关系663个,通过本文的方法自动抽取出856个实体和22578个叁元组关系,丰富和完善了初等数学知识图谱。最后使用构建的数学知识图谱辅助进行初等数学题意理解,通过对题意理解结果的分析表明,建立的知识图谱可以提高数学题意理解的通过率,具有较好的使用价值。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
半自动构建论文参考文献
[1].胡欢,云红艳,贺英,张秀华.半自动构建扶贫领域知识图谱工具的研究[J].计算机与数字工程.2019
[2].段帅阳.初等数学问题知识图谱的半自动构建技术研究及实现[D].电子科技大学.2019
[3].魏巍,傅维刚.面向社交媒体的细粒度ADR本体的半自动构建方法研究[J].图书情报工作.2019
[4].库都来提·阿布都热合曼.小语种领域本体半自动构建技术研究[D].新疆大学.2018
[5].郝嘉树.基于关键词聚类的领域本体层次关系半自动构建研究[J].情报科学.2016
[6].许超凡.基于关系数据库的本体半自动构建系统的设计与实现[D].北京工业大学.2015
[7].尹弼民.基于概念格理论的领域本体半自动构建方法研究[D].南昌大学.2015
[8].傅彦,徐昭邦,夏虎,周俊临.基于逆向匹配的电子商务网站实体模板半自动构建方法[J].中文信息学报.2015
[9].柔特.基于WordNet的藏文语义词典半自动构建方法研究[J].西藏大学学报(自然科学版).2014
[10].华却才让,姜文斌,赵海兴,刘群.基于词对依存分类的藏语树库半自动构建研究[J].中文信息学报.2013