语义提取论文-马慧芳,刘晓倩,马兰,伍诗萌

语义提取论文-马慧芳,刘晓倩,马兰,伍诗萌

导读:本文包含了语义提取论文开题报告文献综述及选题提纲参考文献,主要关键词:语义耦合,图结构,短文本,随机游走

语义提取论文文献综述

马慧芳,刘晓倩,马兰,伍诗萌[1](2019)在《融合语义与图结构的短文本特征提取算法》一文中研究指出针对现有的短文本特征提取算法未充分考虑词语间的隐含语义及图的结构特征,提出了一种融合语义与图结构的短文本特征提取算法,该方法首先根据词语的共现构建文本图;其次,利用词语间内外部语义耦合关系及文本图的结构特征分别计算词语间的相似度对文本图中的边加权;最后,设计了一种随机游走的方法将两种边的加权方案有效地综合起来进行迭代计算出节点的重要性,并降序排序取出前K项作为最终的文本集特征词项集合.中英文数据集上的实验证明了该方法可行且有效.(本文来源于《小型微型计算机系统》期刊2019年09期)

李瀚超,蔡毅,王岭雪[2](2019)在《全局特征提取的全卷积网络图像语义分割算法》一文中研究指出以全卷积神经网络为基础设计图像语义分割算法框架,设计全局特征提取模块提升高维语义特征的提取能力,引入带孔卷积算子保留图像细节并提升分割结果的分辨率。通过搭建端到端的图像语义分割算法框架进行训练,在可见光数据集上对算法框架进行性能评估,结果表明,本文方法在可见光图像上取得良好的语义分割性能和精度。本文还在不借助红外数据标注训练的情况下对红外图像进行分割,结果证明本文方法在典型红外目标如行人、车辆的分割中也有较好的表现。(本文来源于《红外技术》期刊2019年07期)

李朝翻[3](2019)在《基于社交网络文本框架语义分析的药品不良事件提取》一文中研究指出近年来,国内外药品不良事件的发生愈来愈成为一个严重的公共卫生问题。药品不良事件的提取既是有效利用海量社交网络文本医疗信息资源的现实需求,也是提高药品不良事件挖掘效率必须解决的关键问题。药品不良事件提取是通过抓取患者对药物的评论文本,进行框架语义分析,构建词表和不良事件模板,对提取事件结果进行总结及对照,得出相关结论。药品不良事件的提取能及时察觉出药品存在的安全性隐患,有效提高政府的监测效率,减少因无知、寡闻所造成药害事件的持续发生,此外能给予监管者、生产和研究者、流通商、药师、医生、护士、患者和消费者等群体一定的借鉴指导。本文首先对当下国内外药品不良事件提取相关的研究现状进行综述;接着对框架语义学的相关理论进行概述,引出基于框架语义分析的药品不良事件文本分析流程,同时着手构建药品不良事件语义分类词表,为后续的药品不良事件模板构建做好铺垫;其次根据药品不良事件提取流程图衍化出的提取要素构建药品不良事件的模板,并在槽填充下进行了细化的步骤解读,为后续的实验部分提供规范的数据支撑;抓取社交评论中患者对某一药品的评论文本进行实验,实验结果验证了提取方法的真实有效性;最后对研究工作进行总结概括,提出创新点和不足之处,同时简单阐述了对未来研究工作的见解。通过对药品不良事件的提取,能够为提高人类的健康水平做出一定贡献,具有较高的研究价值和意义。(本文来源于《山西大学》期刊2019-06-01)

唐儒星[4](2019)在《基于高层语义特征提取和数据集间不匹配补偿的语种识别方法》一文中研究指出随着当代人工智能研究的蓬勃发展,自动语音识别及其相关技术的应用也越来越广泛。语种识别作为自动语音识别技术的重要组成部分,在包括自动语音转接等多个领域都有着重要的作用。近年来,关于语种识别技术的研究成果层出不穷,性能相比于上世纪已经取得了显着的提升,然而其目前仍面临着高层语义信息利用较少、短时语音处理效果差、易受不同数据集间差异影响等问题。随着语种识别技术重要性的日益凸显,该领域急需研究更为合适的处理方法。为了提升语种识别模型的性能,本文将对基于时序信息的长短时网络与高层语义嵌入向量的语种识别方法进行深入探索。在基于时序信息的长短时神经网络的识别方法中,首先阐述了这类网络对语种时序性信息的提取能力和对语种高层语义信息的概括能力,进而通过结合如瓶颈层特征等包含语音段高层语义信息的特征表达来构建新的网络结构,并以所提取出的反映高层语义信息的嵌入向量代替传统语种识别模型中的语种身份向量来构建新的语种识别模型,以提升语种识别的性能。实验表明,上述两种模型的性能与使用余弦距离分类的i-vector基线系统相比分别有30.07%和20.60%的提高。为了解决语种识别过程中遇到的数据不匹配问题,本文提出了使用基于隐变量子空间因子分析的方法。它的核心思想是根据输入语音段的相关信息,利用其矩阵分解在子空间上的表示方法,通过对长短时神经网络统计信息池化层的输出进行补偿修正,以达到提升语种识别性能的目的。该方法对基于时序信息的长短时网络与高层语义嵌入向量的语种识别方法在不匹配数据集上的性能提升比较明显,两种方法与采用原始模型的方法相比分别提高了约12.6%和23.0%,并且与基于径向基核函数支持向量机分类方法的i-vector基线系统相比性能分别提升了约10.10%和10.88%。(本文来源于《哈尔滨工业大学》期刊2019-06-01)

鹿士义,邓彧君,杨诗雨[5](2019)在《“V着”类存在句构式的语义特征及其提取》一文中研究指出本文考查了北京语言大学BCC语料库"多领域"中"V着"类存在句构式的统计特性,发现出现在该类构式中的动词类-形符频率符合齐夫定律(Zipf’s law),构式对动词具有选择性。同时,依据联想学习理论,利用忠实度、互信息(MI)和关联度(ΔP)等指标对构式与动词之间的关联性进行了测量;通过构建构式中动词的语义网络提取网络的点度中心度、接近中心度、中介中心度和矢量中心度等四个量化语义中心性的指标,探索了"V着"类存在句构式的构式义。(本文来源于《当代外语研究》期刊2019年03期)

刘海彬[6](2019)在《语义角色标注技术研究及在金融信息提取中的应用》一文中研究指出由于近些年来计算机技术和网络通信技术的高速发展,人们对自然语言处理相关技术的需求越来越大。人们希望通过使用自然语言技术来对大量的文本进行处理以更加快速的得到有用的信息。中文信息处理是自然语言处理的一个重要的分支,在基础理论研究和技术开发应用方面获得了显着的成果。语义角色标注作为浅层语义分析的一种简单实现,是自然语言处理任务的一种,而近些年来随着深度学习技术的流行,在自然语言处理任务中使用深度学习技术成为了一种趋势。在当前自然语言处理领域,基于长短期记忆网络(Long Short-Term Memory)的深度学习算法适用于处理较长的序列并能学习到序列中长距离的依赖信息。并有效缓解RNN中会出现的梯度消失和梯度爆炸的问题,因此特别适合处理文本信息。本文主要使用了双向LSTM的神经网络模型并结合CRF(条件随机场)来作为本文的语义角色标注模型,来对本文所使用的金融语料进行标注,得到F1的最佳值为71.65%。本文主要的做的工作如下:一,选用宾州大学中文语料库中的金融相关语料,确定了18类语义角色标签,并对语料进行预处理。二、构建以词向量为输入的Bi-LSTM网络结合CRF作为语义角色模型:这一步将词作为基本标注单元,利用词嵌入(Word2Vector)的方法经过训练的词的向量表达形式。然后将词向量作为输入,通过Bi-LSTM网络层进行处理以得到特征向量表达。最后将得到的特征向量表达通过条件随机场算法进行训练处理和后处理得到语义角色标签。叁、基于词性信息融合得到的最终向量作为语义角色标注模型的输入进行训练:首先将实验语料中的词性标签作为输出向量,然后将词向量作为输入向量输入到Bi-LSTM网络层经过训练学习到词性标签的向量表达形式,然后将词性向量与词向量相结合,构造并训练Bi-LSTM+CRF模型,预测每个单词的相应语义角色标签。最后,对模型的参数进行测试和分析。实验表明,经过词性信息融合后的特征有助于语义角色的识别与分类,使得模型在语料上的表现更加出色。(本文来源于《南昌大学》期刊2019-05-23)

魏洪强[7](2019)在《基于语义分割的单木叁维重建与参数提取》一文中研究指出树木参数是生态系统生产力模拟、碳循环研究、林业管理等领域应用的重要支撑。传统手工测量树木参数方法大多费时费力且通常具有破坏性。基于2D光学遥感数据的树木参数提取方法通常仅能够提取树木顶部表面参数。地面激光雷达(Terrestrial Laser Scanning,TLS)为提取树木参数提供了一种快速有效的技术手段。为提高树木参数准确度和降低参数提取过程的计算复杂度,研究人员通常需要分割树叶和枝干(即语义分割)并对枝干进行叁维重建。本研究在树叶与枝干分割、枝干叁维重建和枝干参数提取叁个方面开展了以下工作:(1)将单最优尺度分割方法推广为多最优尺度分割方法。首先,在预定义的备选尺度集中为每个数据点选择多个最优尺度。其次,在最优尺度集上计算12个常用的3D和2D几何特征。最后,提取到的几何特征被用于训练一个线性判别分析(Linear Discriminant Analysis,LDA)模型并进行树叶和枝干分割。与单最优尺度分割方法相比,多最优尺度分割方法分割准确度更高。与随机多尺度方法相比,多最优尺度方法在尺度较少的情况下稳定性更好。(2)改进了枝干叁维重建方法。首先,采用K近邻(K-Nearest Neighbors,KNN)区域增长并结合密度聚类将枝干TLS数据切割成为类圆柱状数据块。其次,将这些类圆柱状数据块的几何质心作为枝干骨架点。再其次,构建每个枝干骨架点到最近邻的10个枝干骨架点的邻接图并采用最小生成树(Minimum Spanning Tree,MST)算法提取枝干骨架图。最重要的是,利用主成分分析(Principal Component Analysis,PCA)将给定类圆柱状数据块变换到另一个正交空间,变换过程中协方差矩阵的特征值被用于计算枝干半径。最后,利用圆柱拟合方法重建枝干叁维模型。实验结果表明改进的枝干叁维重建方法较好地重建了枝干叁维结构。与SimpleTree软件重建的枝干叁维模型相比,改进的枝干叁维重建方法抗噪声性更强、准确度更高(尤其是细枝)。(3)基于重建的枝干叁维模型提取了每棵实验树木的树高、胸径、枝干体积和枝干表面积。与实测值相比,我们的方法提取的枝干表面积平均误差为28.72%,其余参数的平均误差在8%以内。SimpleTree软件提取的树高和胸径的平均误差在6%以内,提取的枝干体积和枝干表面积平均误差分别高达246.35%和185.24%。与SimpleTree软件提取的参数值相比,我们的方法提取的胸径、枝干体积和枝干表面积更加准确。数据完整性和噪声对我们的方法和SimpleTree软件提取的参数的准确度影响都很大。(本文来源于《电子科技大学》期刊2019-05-19)

李丹阳[8](2019)在《基于AFS提取眉毛形状语义特征的研究》一文中研究指出公理模糊集(Axiomatic Fuzzy Sets,AFS)理论是一种新的模糊数学分析方法,它从更一般、更抽象的层面探讨了模糊集和模糊逻辑,将模糊思想数学公理化,并将人类感知事物的概念及事物间逻辑关系的机理数学抽象化。AFS理论将蕴藏在原始数据、训练数据和数据库中的内在规律和模式,转化成模糊集及逻辑运算,使建立的隶属函数和模糊逻辑更客观和统一。目前AFS理论已经应用到知识表示、聚类分析、模糊分类等领域。针对眉毛的语义描述与聚类难等问题,基于AFS理论提取眉毛的显着特征、定义简单概念、聚类等过程获得眉毛的语义描述符,该算法能够提取出样本最主要的特性,解决描述眉毛语义难,类与类间边界不清晰的问题。主要研究工作包括:(1)针对描述眉毛大小和提取模糊概念难的问题,本文在AFS理论框架下,使用模糊聚类算法开展眉毛的语义特征研究,聚类眉毛大小、赋予语义概念。具体方法为:首先提取人脸图像中眉毛的特征点,利用特征点检测模型归一化人脸图像的特征点,包括眉毛和眼睛;其次基于AFS理论下的模糊聚类算法聚类检测到的眉毛特征点并赋予语义概念;最后通过为每个眉毛分配语义标签提取眉毛的语义描述符。使用BU-4DFE和Multi-PIE数据库验证AFS聚类算法提取眉毛语义的有效性,同时对比分析不同面部表情和相似面部表情对眉毛语义的影响。实验结果表明:通过AFS聚类算法获得的眉毛语义在一致性和可理解性方面是可以与传统的聚类算法(k-均值和模糊c均值)相比较甚至优于它们,获得的眉毛语义更精准,更接近人类感知。此外,面部表情的差异对眉毛语义的提取有显着影响,面部表情的差异越大,对提取的眉毛语义影响越大。(2)针对如何更精准的表示眉毛形状,提取眉毛形状的语义概念等问题,提出了一种改进的方向叁角形面积表示方法(Directional Triangle Area curve Representation,DTAR),通过阂值判断选择表示眉毛的特征点数。首先利用改进的DTAR,计算根据人脸特征点检测模型提取的眉毛特征点的DTAR值,并有序的连接所有表示眉毛的DTAR值,从而生成一条表示该眉毛的DTAR曲线;针对如何表示选择的参考眉毛的问题,依据人脸特征点检测模型的标点规则制订了标注参考眉毛的方法,根据标注的特征点,依据同样的方法获得参考眉毛的DTAR曲线,同时为每个参考眉毛的形状分配语义标签;最后,基于AFS下的隶属函数计算眉毛形状的DTAR曲线与参考眉毛的DTAR曲线之间的相关度,通过选择相似度最高的前两个的参考眉毛的语义描述眉毛形状。为了验证所提出方法的有效性及与人类感知的一致性,利用AR人脸库和BJUT眉毛库进行一致性验证。实验结果表明:基于改进的DTAR选择表示眉毛的特征点数比直接使用DTAR提取的眉毛形状的语义描述符更符合人类的感知。(本文来源于《北方工业大学》期刊2019-05-06)

佟悦[9](2019)在《“N_1中的N_2”后槽成分语义特征的互动提取》一文中研究指出囿限性短语"N_1中的N_2"通过向N_1槽与N_2槽输入参数实现短语生成。本文以格式塔心理学、隐喻思维、容器图式、"参照体-目标"构式等为理论支撑,证明"N_1中的N_2"有两种语义模式:一种为容器与内容物具有不同属性的二元容器构式;另一种为容器与内容物具有相同属性的一元容器构式。N_1与N_2的依存程度决定N_2语义特征的提取方式:当无需参照N_1便可得N_2语义特征时,以静态独立方式提取;当需要参照N_1才能确定N_2语义特征时,以依存互动方式提取。(本文来源于《汉语学习》期刊2019年02期)

徐媛媛,周之澄[10](2019)在《花卉旅游商品设计语义符号的提取与转译研究》一文中研究指出本文以"2014首届全国花卉旅游商品创意设计大赛"参赛作品为案例研究对象,从外延与内涵这两类语义符号维度出发,利用内容分析与定量统计方法,梳理花卉旅游商品设计中色彩、造型及旅游地场所精神的提取与转译过程,从设计师视角探究语义符号在花卉旅游商品设计中所起的作用。(本文来源于《装饰》期刊2019年04期)

语义提取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

以全卷积神经网络为基础设计图像语义分割算法框架,设计全局特征提取模块提升高维语义特征的提取能力,引入带孔卷积算子保留图像细节并提升分割结果的分辨率。通过搭建端到端的图像语义分割算法框架进行训练,在可见光数据集上对算法框架进行性能评估,结果表明,本文方法在可见光图像上取得良好的语义分割性能和精度。本文还在不借助红外数据标注训练的情况下对红外图像进行分割,结果证明本文方法在典型红外目标如行人、车辆的分割中也有较好的表现。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语义提取论文参考文献

[1].马慧芳,刘晓倩,马兰,伍诗萌.融合语义与图结构的短文本特征提取算法[J].小型微型计算机系统.2019

[2].李瀚超,蔡毅,王岭雪.全局特征提取的全卷积网络图像语义分割算法[J].红外技术.2019

[3].李朝翻.基于社交网络文本框架语义分析的药品不良事件提取[D].山西大学.2019

[4].唐儒星.基于高层语义特征提取和数据集间不匹配补偿的语种识别方法[D].哈尔滨工业大学.2019

[5].鹿士义,邓彧君,杨诗雨.“V着”类存在句构式的语义特征及其提取[J].当代外语研究.2019

[6].刘海彬.语义角色标注技术研究及在金融信息提取中的应用[D].南昌大学.2019

[7].魏洪强.基于语义分割的单木叁维重建与参数提取[D].电子科技大学.2019

[8].李丹阳.基于AFS提取眉毛形状语义特征的研究[D].北方工业大学.2019

[9].佟悦.“N_1中的N_2”后槽成分语义特征的互动提取[J].汉语学习.2019

[10].徐媛媛,周之澄.花卉旅游商品设计语义符号的提取与转译研究[J].装饰.2019

标签:;  ;  ;  ;  

语义提取论文-马慧芳,刘晓倩,马兰,伍诗萌
下载Doc文档

猜你喜欢