语义集成论文_邱金鹏

导读:本文包含了语义集成论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语义,模型,本体,概念,标签,通信,词性。

语义集成论文文献综述

邱金鹏[1](2019)在《基于集成学习的动态Web页面语义标注方法研究》一文中研究指出传统Web页面语义标注方法需手工处理,或只可将Web页面中有属性的标签赋予数据,针对无属性标签数据不进行标注,不适于大规模Web页面信息标注,且标注结果不可靠。为此,提出一种新的基于集成学习的动态Web页面语义标注方法。给出动态Web页面语义标注流程。将Web页面转换成DOM树,识别待标注文本。选取抽取信息特征与训练Web页面特征,将含有语义信息的内容分配至概念抽象化的本体上,采用多分类器集成学习方法进行分类,区分待标注信息是属性标签还是数据元素,通过不同分类器预测结果的一致性对相应样本被准确标注的置信度进行衡量。通过训练页面中涵盖的属性标注规则集与抽取信息中的属性名称实现语义标注。实验结果表明,所提方法适于大规模动态Web页面语义标注,标注结果可靠。(本文来源于《科技通报》期刊2019年10期)

Waheed,Yousuf,Ramay[2](2019)在《自动本体集成与语义网的语义注释》一文中研究指出语义网络的概念视图指的是利用软件代理处理文档网络从而挖掘出网络信息。为了在现有网络上实现某些目标,语义注释和本体集成起着至关重要的作用。然而,最近的研究表明,由于一些问题语义网络尚未被完全建立。其中最重要的是语义网络大数据的自动语义本体集成和语义注释。为了克服这些问题,本文提出一个自动化语义本体集成、大数据定位和语义注释的框架。同一领域的多本体的使用可能会引起本体之间的异质性问题。本体集成为异质性问题提供了解决方案。本文研究了引起异质性问题的本体集成中的概念匹配过程,并提出了一种概念匹配的自动语义比较方法。该方法采用自然语言处理技术,避免了概念语义匹配中的词汇或语料库,而这是当前最优方法的主要局限性。因此,这项工作的目的是建立一个更强大的智能最先进的系统,用于本体集成。另一方面,有关面向业务的系统的大多数数据仍然基于NoSQL或关系数据模型。当前,语义网络数据模型RDF已成为数据建模和分析的新标准。基于这种情况,NoSQL的集成、RDB和RDF数据模型正在成为系统的一项必需的功能。在本研究中,我们的目标是比较和映射数据模型,用于转换NoSQL,RDB和语义网络。这项研究将有助于在使用语义网络的大数据数据注释中实现更好的数据检索和存储系统。在自然语言处理的背景下,关键词提取得到了广泛的研究。在推广企业商品和Web服务时,关键字提取是许多基于知识的应用程序的重要组成部分,如自动索引、知识发现、术语挖掘和监控、知识管理。然而,有效和高效地从社交媒体用户生成的数据中提取关键字是个重要挑战。目前其中使用的是传统的、依赖于语言的和受监督的关键字提取技术。作为一种独立于语言和无监督的关键字提取技术,本研究贡献了一种利用层次分析法(KEAHP)的关键词提取方法,以进行本体构建。(本文来源于《北京科技大学》期刊2019-06-03)

熊昌镇,智慧[3](2019)在《多模型集成的弱监督语义分割算法》一文中研究指出为减小池化操作造成空间信息丢失的影响,提高基于迁移学习的弱监督语义分割算法的性能,提出一种多模型集成的弱监督图像语义分割算法.该算法在迁移学习算法的基础上,利用多尺度图像的高层语义特征和单尺度图像的高中层相结合的卷积特征,分别训练2个差异化的同质型基分割模型,并与原迁移学习训练的分割模型进行加权平均,集成构造最后的分割模型.同时结合预测类别可信度调整语义分割中对应类别像素的可信度,抑制分割图中的假正例区域,提高分割的精度.在VOC2012数据集上进行实验的结果表明,验证集上的平均重迭率为55.3%,测试集上的平均重迭率为56.9%,比原迁移学习算法分别提升6.1%和11.1%,也优于其他以类标为弱监督信息的语义分割算法.(本文来源于《计算机辅助设计与图形学学报》期刊2019年05期)

金妙然[4](2019)在《基于语义向量的集成学习研究与应用》一文中研究指出随着信息化社会的发展,来源于互联网的文本信息越来越多。如今文本数量巨大且更新速度很快,人工进行文本分类要耗费大量的时间和人力成本,因此文本的自动化分类具有重要的应用价值。文本分类的第一步是将非结构化的文本转换成结构化的语义向量,语义向量可以对文本进行降维、过滤,筛选出重要的信息,为后续的文本分类带来性能和效率的提升,但是目前构建的文本语义向量在对分类效果的提升上还有待改进。文本分类的第二步是将文本向量通过分类器进行文本分类,并输出结果,目前的常见分类器在分类的精度和运行的效率还可以有所提升。集成学习近些年发展迅速,也可以作为分类器进行文本的分类。本文构建了新的语义向量tdCHI,并将构建的语义向量输入到改进的XGBoost集成学习算法进行文本分类。本文的主要创新点如下:(1)构建了便于文本分类的改进的语义向量tdCHI。tdCHI语义向量结合了word2vec和改进的卡方检验,具有丰富的语义信息且维度较低。针对卡方检验存在的低频词缺陷问题,引入了t检验增加词频的权重;针对卡方检验的值只代表相关性,卡方值大的时候可能是负相关的问题,加入了过滤函数对结果进行过滤;针对卡方检验只考虑特征项对类别的区分度,不考虑特征项在具体文章中重要性的问题,引入了TF-IDF算法。并以实验证明tdCHI语义向量对于文本分类性能的提升。(2)针对应用于文本分类环境,对XGBoost集成学习算法做出了改进。针对XGBoost默认的处理缺失值方法没有考虑文本分类特性的问题,结合tdCHI语义向量,循环选取排名靠前的特征项填补缺失值,改进了XGBoost处理缺失值的方法。并以实验证明了改进的缺失值处理方法相比于默认的处理缺失值方法、其他常见缺失值处理方法,更能提升文本分类的准确性。然后针对不平衡样本的问题,分析了XGBoost默认得分函数的不足,并引入了宏平均,设计了新的得分函数。并以实验证明了设计的得分函数不论在平衡样本还是不平衡样本的情况下,都具有较好的文本分类性能。最后在总体实验中证明了基于tdCHI语义向量的XGBoost集成学习分类器,能够提升文本分类的性能,并拥有较好的运行效率。(本文来源于《电子科技大学》期刊2019-05-14)

朱莉莉[5](2019)在《BIM与GIS集成下的建筑物语义模型转换研究》一文中研究指出实现现代城市建筑物室内外一体化建模技术一直以来都是推进智慧城市建设的核心。常规的测绘手段只能获取建筑物的几何轮廓,忽略了模型的语义和拓扑关系,仅可用于叁维可视化,无法满足空间数据挖掘和专题查询等深层次应用技术需求。此外,这些模型无法获取建筑物的室内信息,尤其是家具等室内部件。因此目前对于建筑物叁维模型空间信息化的需求变得越来越迫切。建筑信息模型(Building Information Model,BIM)精细化叁维模型语义信息丰富,对建筑物内部的信息描述十分精细。叁维地理信息系统(Three-Dimensional Geographic Information System,3DGIS)致力于室外信息的建模技术,室内信息比较匮乏,无法将GIS模型应用于城市灾害应急响应及室内导航等应用中。因此,BIM模型精确的信息可以作为3DGIS重要的数据来源,本文通过分析BIM领域的通用数据标准行业基准类(Industry Foundation Classes,IFC)和叁维GIS领域的数据标准城市地理标记语言(City Geography Markup Language,CityGML)在几何和语义上的差异,以及室内信息模型相关标准的特点,设计并实现从1FC模型转换为语义丰富的CityGMLLOD4模型的方法。由于IFC模型比CityGML模型语义要更丰富,二者之间存在语义信息不对称的问题,直接进行IFC模型到标准的CityGML模型转换会存在语义信息的丢失。因此,本文结合IFC模型建筑物构件复杂的特点,利用CityGML的扩展机制,对建筑物叁维语义模型进行扩展,形成一种基于CityGML扩展的建筑物多尺度语义表达的信息模型。把IFC模型中丰富的语义信息提取到扩展的CityGML模型中。将基于IFC标准构建的建筑物模型集成到GIS系统进行统一管理,首先要建立IFC与CityGML的语义映射关系,通过语义信息之间的映射,过滤IFC模型中无几何信息的语义。然后,根据二者在几何方面的差异,首先进行了坐标系的转换,之后将构造实体表达的IFC模型转换为CityGML中的表面模型。最终获取几何和语义均正确的CityGML模型。基于本文提出的方法,设计符合本文需求的自定义CityGML扩展模式,这种扩展的CityGML模型,能够将IFC模型中丰富的语义集成到CityGML中。最后通过设计实验并测试分析,结果表明,本文的转换方法能够将IFC模型自动转换为几何正确和语义丰富的CityGML模型。并通过与目前常用的转换方法作对比,得出本文的转换方法的有效性。因此,本文的方法能够为实现BIM与GIS的融合提供有力的支持。(本文来源于《华中师范大学》期刊2019-05-01)

尹玉[6](2019)在《基于Spark的半监督集成学习的视频语义概念检测》一文中研究指出随着智能携带设备所代表的移动互联网的兴起,视频语义概念检测技术越来越成为当今的热门研究方向。视频语义概念检测应用活跃在人们日常生活中的互联网视频、交通安全、视频监控和视频医疗等各个角落,但是由于视频内容的复杂、多变和噪声等问题的存在,视频语义概念检测研究仍然面临着巨大的挑战。在研究了大量的国内外文献之后,首先,对视频语义概念检测的背景、意义和国内外研究现状进行了简单的陈述;其次,简述了半监督学习、集成学习、视频语义概念检测技术的相关知识;再次,针对国内外的研究所存在问题,本文重点研究了伪标签置信选择的半监督集成学习的视频语义概念检测方法和基于Spark的视频语义概念处理检测框架,并且为了验证所提方法和框架的可用性,设计实现了基于Spark的视频语义概念检测原型系统。本文的主要研究工作如下:(1)为了解决有标记样本不足会严重影响视频语义概念检测的性能问题和伪标签样本中的噪声会导致集成学习基分类器性能提升不足问题,提出了一种伪标签置信选择的半监督集成学习的视频语义概念检测方法。首先,在叁个不同的特征空间上训练出叁个基分类器,得到基分类器的标签矢量;然后,引入加权融合样本所属某个类别的最大概率与次大概率的误差和样本所属某个类别的最大概率与样本所属其它各类别的平均概率误差,作为基分类器的标签置信度,融合标签矢量和标签置信度得到样本的伪标签和伪标签置信度;接着,选择伪标签置信度高的样本加入到有标签的样本集,迭代训练基分类器;最后,采用训练好的基分类器集成协作检测视频语义概念。本方法选择的伪标签能体现样本所属类别与其它类别的总体差异性,又体现所属类别的唯一性,可减少利用伪标签样本的风险,实验结果表明,本方法可有效提高视频语义概念检测的准确率。(2)为了解决视频语义概念检测运行效率低下的问题,提出了一种基于Spark的视频语义概念处理检测框架。该框架包括基于Spark的视频语义关键帧提取框架、基于Spark的视频语义特征提取框架、基于Spark的半监督集成分类器模型训练框架和基于Spark的视频语义分类检测框架。该框架可以内存式并行化处理视频语义关键帧提取、特征提取、模型训练和视频语义分类检测。在不同实验环境上做了对比实验,实验结果表明,所提框架可以明显提升关键帧提取、特征提取、视频语义模型训练和分类检测的运行速度,提高其运行效率。同时,还总结了集群可用CPU核心数和集群可用内存大小对本框架运行效率的影响趋势和制约本框架效率提升的影响因素。(3)为了验证所提出的伪标签置信选择的半监督集成学习视频语义概念检测方法和基于Spark的视频语义概念处理检测框架的可用性,选用Ubuntu16.04、HDFS、Python、Sklearn和OpenCV等技术或者环境,设计并且实现了基于Spark的视频语义概念检测原型系统。系统界面简洁,使用简单,对用户友好,验证了所提方法和框架的可用性。(本文来源于《江苏大学》期刊2019-04-01)

尹玉,詹永照,姜震[7](2019)在《伪标签置信选择的半监督集成学习视频语义检测》一文中研究指出在视频语义检测中,有标记样本不足会严重影响检测的性能,而且伪标签样本中的噪声也会导致集成学习基分类器性能提升不足。为此,提出一种伪标签置信选择的半监督集成学习算法。首先,在叁个不同的特征空间上训练出叁个基分类器,得到基分类器的标签矢量;然后,引入加权融合样本所属某个类别的最大概率与次大概率的误差和样本所属某个类别的最大概率与样本所属其他各类别的平均概率的误差,作为基分类器的标签置信度,并融合标签矢量和标签置信度得到样本的伪标签和集成置信度;接着,选择集成置信度高的样本加入到有标签的样本集,迭代训练基分类器;最后,采用训练好的基分类器集成协作检测视频语义概念。该算法在实验数据集UCF11上的平均准确率到达了83. 48%,与Co-KNN-SVM算法相比,平均准确率提高了3. 48个百分点。该算法选择的伪标签能体现样本所属类别与其他类别的总体差异性,又能体现所属类别的唯一性,可减少利用伪标签样本的风险,有效提高视频语义概念检测的准确率。(本文来源于《计算机应用》期刊2019年08期)

宫萍,王理,张辉,魏思远,王馨[8](2019)在《基于语义本体的科技资源集成建模研究》一文中研究指出科技资源呈现不断丰富和多元化的发展趋势,以不同类型和机构分散存储在不同机构、数据库和网站。为提高科技资源服务的效率,本文研究科技资源的集成建模方法,对科技资源的内涵和分类进行了定义和建模,分析了数字科技资源的集成技术,提出了基于语义本体的科技资源集成框架,对多源异构科技资源的集成提供方法。(本文来源于《标准科学》期刊2019年03期)

何云,李彤,王炜,李响,兰微[9](2019)在《一种面向软件特征定位问题的语义相似度集成方法》一文中研究指出特征是软件系统中被需求所定义的可执行功能实体.识别软件特征与源代码间映射关系的过程被称作特征定位.基于信息检索的特征定位方法由于高易用性和低开销等优点,被广泛应于软件维护、代码搜索等领域.所有基于信息检索的特征定位方法均建立在语义相似度计算基础之上,当前语义相似度计算存在2个主要问题:第一,源代码数据中大量噪声信息对相似度计算的干扰;第二,不同索引方法局限性导致的相似度计算结果失准.针对这2个问题,提出了一种面向软件特征定位问题的语义相似度集成方法.该方法在预处理过程引入词性过滤,有效过滤源代码中噪声数据,提升相似性计算的准确度.然后,以源代码数据自身结构特性为依据,集成不同索引方法进行相似度计算.在公开数据集上进行了实验,与现有方法相比,词性过滤和相似度集成在平均排序倒数性能上分别带来了30.88%和10.28%的提升,验证了所提方法的有效性.(本文来源于《计算机研究与发展》期刊2019年02期)

张泽正[10](2018)在《基于模糊神经网络和二元语义集成的通信台站评估方法》一文中研究指出无线通信台站是部队通信的基础单元,其效能的好坏,直接决定了作战行动的信息能力支撑程度。目前针对无线通信性能的研究也较多,但都存在一定问题,有的评估方法是对影响因素的简单线性迭加,有的是过于依赖专家经验,主观影响较大,有的是对定性和定量问题之间的转化不够准确。本文立足单位实际应用,提出一种基于模糊神经网络和二元语义集成的通信台站评估系统,模糊神经网络是将模糊控制理论和人工神经网络相结合的产物,取长补短、互相支撑,使得系统有很好的鲁棒性。本文设计的系统包括预处理模块、自学习模块和评估模块等叁个模块。数据预处理模块是将数据进行清洗整理,区分主观因素和客观因素,将数据输入不同的模块。客观因素包括地形、天候、电磁环境、功率等,数据进行归一化处理后输入自学习模块,自学习模块判断是否需要触发自学习,如不需要,根据模糊神经网络判定的结果输入评估模块。而主观因素,包括人员素质、设备情况等,因评估主观性、随机性较大,其值经过预处理模块时进行二元语义转换,在评估模块中与自学习模块判断的客观因素评估结果进行二元语义加权集成,作为最终评判结果。本系统是立足于单位实际应用所设计的,在指标的考量上尽量做到了效率和准确度的统一,学习样本的选择是基于往年通信台站开设所积累的真实数据。通过仿真测试,基本上与测试样本所吻合,虽有一定的离散点,但是通过实际分析,误差都在可以接受的范围内,对通信台站的评估具有较强的指导意义。(本文来源于《郑州大学》期刊2018-11-01)

语义集成论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

语义网络的概念视图指的是利用软件代理处理文档网络从而挖掘出网络信息。为了在现有网络上实现某些目标,语义注释和本体集成起着至关重要的作用。然而,最近的研究表明,由于一些问题语义网络尚未被完全建立。其中最重要的是语义网络大数据的自动语义本体集成和语义注释。为了克服这些问题,本文提出一个自动化语义本体集成、大数据定位和语义注释的框架。同一领域的多本体的使用可能会引起本体之间的异质性问题。本体集成为异质性问题提供了解决方案。本文研究了引起异质性问题的本体集成中的概念匹配过程,并提出了一种概念匹配的自动语义比较方法。该方法采用自然语言处理技术,避免了概念语义匹配中的词汇或语料库,而这是当前最优方法的主要局限性。因此,这项工作的目的是建立一个更强大的智能最先进的系统,用于本体集成。另一方面,有关面向业务的系统的大多数数据仍然基于NoSQL或关系数据模型。当前,语义网络数据模型RDF已成为数据建模和分析的新标准。基于这种情况,NoSQL的集成、RDB和RDF数据模型正在成为系统的一项必需的功能。在本研究中,我们的目标是比较和映射数据模型,用于转换NoSQL,RDB和语义网络。这项研究将有助于在使用语义网络的大数据数据注释中实现更好的数据检索和存储系统。在自然语言处理的背景下,关键词提取得到了广泛的研究。在推广企业商品和Web服务时,关键字提取是许多基于知识的应用程序的重要组成部分,如自动索引、知识发现、术语挖掘和监控、知识管理。然而,有效和高效地从社交媒体用户生成的数据中提取关键字是个重要挑战。目前其中使用的是传统的、依赖于语言的和受监督的关键字提取技术。作为一种独立于语言和无监督的关键字提取技术,本研究贡献了一种利用层次分析法(KEAHP)的关键词提取方法,以进行本体构建。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语义集成论文参考文献

[1].邱金鹏.基于集成学习的动态Web页面语义标注方法研究[J].科技通报.2019

[2].Waheed,Yousuf,Ramay.自动本体集成与语义网的语义注释[D].北京科技大学.2019

[3].熊昌镇,智慧.多模型集成的弱监督语义分割算法[J].计算机辅助设计与图形学学报.2019

[4].金妙然.基于语义向量的集成学习研究与应用[D].电子科技大学.2019

[5].朱莉莉.BIM与GIS集成下的建筑物语义模型转换研究[D].华中师范大学.2019

[6].尹玉.基于Spark的半监督集成学习的视频语义概念检测[D].江苏大学.2019

[7].尹玉,詹永照,姜震.伪标签置信选择的半监督集成学习视频语义检测[J].计算机应用.2019

[8].宫萍,王理,张辉,魏思远,王馨.基于语义本体的科技资源集成建模研究[J].标准科学.2019

[9].何云,李彤,王炜,李响,兰微.一种面向软件特征定位问题的语义相似度集成方法[J].计算机研究与发展.2019

[10].张泽正.基于模糊神经网络和二元语义集成的通信台站评估方法[D].郑州大学.2018

论文知识图

一6地理空间信息语义查询示例综合匹配算法伪码Fig.4.7Thesyntheti...一8语义web服务实现实例分析面向MRO的企业语义集成及业务协同...充电站语义集成架构电子目录语义集成与智能服务系...

标签:;  ;  ;  ;  ;  ;  ;  

语义集成论文_邱金鹏
下载Doc文档

猜你喜欢