相似度算法论文_王直荣,陈章位,张翔,毛晨涛,王宇翔

导读:本文包含了相似度算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:算法,文本,余弦,向量,句子,改进型,方法。

相似度算法论文文献综述

王直荣,陈章位,张翔,毛晨涛,王宇翔[1](2019)在《基于DSW的机器人运动轨迹相似度算法》一文中研究指出机器人轨迹相似度度量是机器人性能测量的重要组成部分。针对机器人运动轨迹数据的测量噪声大、传统相似度算法时空复杂度大的问题,提出了一种基于动态滑动窗口(Dynamic Sliding Window,简称DSW)的机器人运动轨迹相似度计算方法。实验结果表明,与传统的轨迹相似度计算方法相比,在保持计算结果准确性的前提下,所提出的DSW算法在时空复杂度方面有显着改善,验证了DSW算法的有效性。(本文来源于《第十叁届全国振动理论及应用学术会议论文集》期刊2019-11-09)

何宏,廖巍,唐林丰,刘勋寒[2](2019)在《基于文本相似度算法的融合推荐系统的设计与实现》一文中研究指出针对目前各类推荐系统存在推荐商品的用户满意度不理想和用户依赖程度比较低的问题,该文从用户的评分和行为两个角度,构建了将传统基于用户的协同过滤算法和文本相似度算法进行融合的改进算法模型,使推荐系统从用户角度进行推荐,并且实时更新,从而有效提高用户满意度和用户的依赖程度。(本文来源于《科技资讯》期刊2019年28期)

张洪,钟凯迪,柴源,魏济,吴艳[3](2019)在《基于N-Gram和动态滑动窗口的改进余弦相似度算法研究》一文中研究指出为了解决余弦相似度算法进行数据清洗时重复与相似的数据会使计算量呈几何级增长的问题,提出了基于N-Gram和动态滑动窗口的改进余弦相似度算法.首先通过计算每条数据的N-Gram值,并对数据进行相似度排序,然后定义初始滑动窗口,其窗口值根据N-Gram值的方差动态调整,最后在每个窗口中根据相似度与阀值判断相似数据.实验结果表明,改进的余弦相似度算法在运行速度上有大幅度提高,数据清洗准确率也得到提升,且该算法适用于海量数据的情形.(本文来源于《成都大学学报(自然科学版)》期刊2019年02期)

单嵩岩,吴振新[4](2019)在《面向作者消歧和合作预测领域的作者相似度算法述评》一文中研究指出从文本相似度和结构相似度算法入手,对面向作者消歧和科研合作预测领域的作者相似度算法进行了研究。分析和比较了各种常用算法的优劣,以及目前的应用情况,并对作者相似度算法进行系统梳理与展望.(本文来源于《东北师大学报(自然科学版)》期刊2019年02期)

姜希伟,邹家丽,项荣武,于净,高翔[5](2019)在《基于最大相似度算法的补阳中药归肾经的量化探讨》一文中研究指出目的:从靶点组织表达角度构建补阳中药归肾经的判别标准,为中药归经的量化研究提供新思路、新方法。方法:选取9味补阳中药作为训练集,2味补阳中药作为验证集,通过TCMSP2. 3,Pub Chem,Uniprot等数据库搜集药材化学成分及其作用靶点,采用最大相似度算法获得补阳中药核心靶蛋白;利用THPA数据库获得靶蛋白相关组织表达及表达丰度数据;通过训练集数据构建经验回归方程,挖掘药材作用受体的组织分布规律,建立补阳中药归肾经的判别标准模型;通过验证集数据对模型进行检验。结果:构建药材-活性成分-作用蛋白受体-组织表达数据全集库,筛选补阳中药核心靶蛋白39个,训练集药材的组织分布规律具有高度一致性,没有统计学差异(P=0. 999 7),构建补阳中药归肾经的判别标准模型。经验证集数据检验,模型的准确率100%。结论:本研究探索补阳中药归肾经的判别标准新方法,并建立有效的判别标准模型,验证了新方法的可靠性。为中药归经的现代化研究提供了理论基础,对于中医药学的快速发展有着重要意义。(本文来源于《中国实验方剂学杂志》期刊2019年18期)

王明阳[6](2019)在《句子级和段落级的语义相似度算法的设计与实现》一文中研究指出随着自然语言处理技术的飞速发展,句子级语义相似度算法有了更多的应用场景,如从数据库中选出与用户问题最匹配的回答、从数据集中选出翻译效果最好的单词序列、以及文本分类和排序等等。段落级语义相似度算法同样具有较多的应用场景和较大的研究价值。相比句子,段落结构更复杂、维度更高,因此段落级语义相似度的研究难度更高。针对句子级和段落级语义相似度算法研究,本文的贡献主要有以下叁点:第一,采用自注意力机制中的多抽头注意力提取方法改进了句子级语义相似度算法。相较于长短期记忆网络的方法,本文提出的语义相似度算法有两点优势:1)可以得到多个特征图谱,从而实现多角度提取语义特征;2)能够直接计算句子中任意两个词语之间的语义关联度。改进后的句子级相似度模型相比基础模型实验效果有所提升,并优化了社区问答系统。第二,提出了基于文本摘要的段落级相似度算法。在文本研究中,相较于句子,段落的文本跨度更大、维度更复杂。为了降低段落间的长度及维度的差异带来的语义计算难度,本文提出了基于生成摘要的段落级相似度方法。抽取后的摘要既可以表达段落的主要思想,又降低了段落间的维度差异。该方法便于计算,提高了语义计算的效率。第叁,通过引入交互信息层和交叉注意力机制,进一步改进了段落级语义相似度算法。传统的语义相似度计算中,文本表示只是包含了自身的语义信息。本文提出的方法是通过交互信息层和交叉注意力机制融入了文本对之间的交互信息,增强了文本对间的联系,与句子级相似度算法结合,优化了社区问答系统。(本文来源于《北京邮电大学》期刊2019-05-21)

徐鑫鑫[7](2019)在《基于WMD距离的文本相似度算法研究》一文中研究指出随着AI技术的迅速崛起,人工智能和随之而来的海量文本数据对自然语言处理也提出了更高的要求。文本相似度作为自然语言处理领域的一大基础任务,在搜索引擎、QA系统、机器翻译、文本分类、拼写纠错等领域有广泛的应用。文本作为承载语义信息的一种重要方式,传统的文本表示采用向量空间模型来表达语义信息,这种方式未考虑到特征词的顺序以及上下文语义理解,造成高维稀疏以及计算效率低的问题。WMD距离算法利用word2vec中的语义信息,实现高度语义共现精确度,并能挖掘出独立词之间的语义相关性。因此本文的研究工作基于WMD距离算法展开,在WMD距离算法的基础上充分挖掘文本语义中有价值的特征项以及结合知识词典中的语言学知识构架和句法依存关系,提出了两种改进算法。本文的主要工作有:1.本文基于WMD距离算法存在过于单一的词频权重无法有效提取文本特征及利用语义信息的问题,提出了WMD-JCS(Word Mover’s DistanceJoint Character and Sentence)算法。该改进算法将原始的词频权重代替为使用TF-IDF系数、词语词性以及出现的物理位置作为新的文本特征项,并将这些特征项以合理的数学计算公式加入算法中;其次将训练好的词向量以无监督方式构造句子的句向量,以充分考虑语义的上下文环境;最后将筛选出的关键词的词向量和句向量参与计算改进后的距离公式。实验表明,该改进算法与WMD距离算法相比,可以有效提高文本相似度的准确度。2.基于上述第一种改进的WMD-JCS算法,本文提出了另一种改进算法WMD-WSA(Word Mover’s Distance-Word Sense Analysis)。由于基于深度学习的计算方法的语义可解释性差以及WMD-JCS算法存在无法融合深层语义相关性信息的问题,该算法首先基于HowNet常识性知识库和句法依存关系从语言学的角度更深层次地挖掘词汇的语义信息,以此计算词语和句子间的相似度;接着将相似度转化为词句间的转移代价,对距离公式进行改进。实验表明,该算法取得了更高的准确率、召回率和F1值,进一步提升文本相似度计算精度。(本文来源于《太原理工大学》期刊2019-05-01)

栗蒙光[8](2019)在《基于改进的文本相似度算法的中文文本分类技术研究》一文中研究指出随着大数据时代的到来,各种类型的数据呈几何级数增长,如何在海量的数据中挖掘出真正有价值的信息就成了重中之重。而对于文本数据,如何对繁多的数据进行高效、准确的分类十分关键,这就需要我们对文本分类技术进行深入的研究和分析。另外,文本分类技术作为自然语言处理中的关键技术,也是实现许多常用应用的前提和基础,诸如问答系统、情感分析、关系抽取等等。中文文本分类技术虽然起步相对较晚,而且面临更加复杂的语法分析问题,但随着相关文本处理算法的研究和改进以及数据运算性能的提高,中文文本分类技术也取得了长足的进步和发展。本文先是对比分析了几种基于文本相似度算法的文本分类技术,然后说明了中文文本独特的语义、语法结构,即中文文本是以词语作为句子含义表述的基本单元;中文文本中不同词性的词语所包含的信息量差异较大等特点。基于此,对中文文本分类中的文本相似度算法进行了改进,采用了基于统计学和基于语言学相结合的方法来计算中文文本相似度。另外,在数据预处理之后进行中文分词时对现有的分词方法进行了改进和优化,并结合实验数据特点对常用的评价标准也进行了改进。最后通过对比实验和分析,基于改进后的文本相似度算法的中文文本分类方法在最终实验中取得了72%的准确率,和基于向量空间模型的相似度算法的中文文本分类方法相比提高了近20%,表明了改进后的中文分词方法和基于词性标注和词向量模型的文本相似度算法在中文文本分类中确实能够取得更为理想的分类结果。(本文来源于《兰州大学》期刊2019-05-01)

肖尚,房至一,董洪良,赵帅,王涵瑜[9](2018)在《基于改进型VSM-HowNet融合相似度算法研究》一文中研究指出随着信息科学技术的发展和互联网技术的普及,社会上出现了越来越多的以博取观众的眼球为目的的"标题党"现象。为了识别"标题党"新闻,给出了一种基于改进型的VSM结合余弦相似度的文本相似度计算方法和《知网》(How Net)文本相似度计算方法,并研究了基于改进型VSM-HowNet融合相似度算法,用这些文本相似度的计算方法分别和已有研究中的王氏主题-词形文本相似度计算方法做对比。此方法对"标题党"新闻识别的总准确率、总召回率及总F1值均高于其他文本相似度计算方法,对于识别一篇未知类型的新闻,改进型VSM-HowNet融合相似度算法相比于其他文本相似度计算方法更有优势。(本文来源于《吉林大学学报(信息科学版)》期刊2018年06期)

田星,郑瑾,张祖平[10](2018)在《基于词向量的Jaccard相似度算法》一文中研究指出通过对传统Jaccard算法的研究和改进,提出了一种基于词向量的Jaccard句子相似度算法。传统的Jaccard算法以句子的字面量为特征,因而在语义层面的相似度计算方面受到了一定的限制。而随着深度学习的兴起,尤其是词向量的提出,词语在计算机中的表示有了突破性的进展。该算法首先通过训练将每个词语映射为语义层面的高维向量,然后计算各个词向量之间的相似度,高于阈值α的作为共现部分,最终计算句子的相似度。实验表明,相较于传统的Jaccard算法,该算法在短文本相似度计算的准确率上有较明显的提升。(本文来源于《计算机科学》期刊2018年07期)

相似度算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对目前各类推荐系统存在推荐商品的用户满意度不理想和用户依赖程度比较低的问题,该文从用户的评分和行为两个角度,构建了将传统基于用户的协同过滤算法和文本相似度算法进行融合的改进算法模型,使推荐系统从用户角度进行推荐,并且实时更新,从而有效提高用户满意度和用户的依赖程度。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

相似度算法论文参考文献

[1].王直荣,陈章位,张翔,毛晨涛,王宇翔.基于DSW的机器人运动轨迹相似度算法[C].第十叁届全国振动理论及应用学术会议论文集.2019

[2].何宏,廖巍,唐林丰,刘勋寒.基于文本相似度算法的融合推荐系统的设计与实现[J].科技资讯.2019

[3].张洪,钟凯迪,柴源,魏济,吴艳.基于N-Gram和动态滑动窗口的改进余弦相似度算法研究[J].成都大学学报(自然科学版).2019

[4].单嵩岩,吴振新.面向作者消歧和合作预测领域的作者相似度算法述评[J].东北师大学报(自然科学版).2019

[5].姜希伟,邹家丽,项荣武,于净,高翔.基于最大相似度算法的补阳中药归肾经的量化探讨[J].中国实验方剂学杂志.2019

[6].王明阳.句子级和段落级的语义相似度算法的设计与实现[D].北京邮电大学.2019

[7].徐鑫鑫.基于WMD距离的文本相似度算法研究[D].太原理工大学.2019

[8].栗蒙光.基于改进的文本相似度算法的中文文本分类技术研究[D].兰州大学.2019

[9].肖尚,房至一,董洪良,赵帅,王涵瑜.基于改进型VSM-HowNet融合相似度算法研究[J].吉林大学学报(信息科学版).2018

[10].田星,郑瑾,张祖平.基于词向量的Jaccard相似度算法[J].计算机科学.2018

论文知识图

轮廓点分布直方图螳螂(a)端爪图像和(b)Coreltrace中轮...实验过程数据不同λ取值的AP算法迭代过程示意图分割结果对比模型1精简结果对比(β=80%)

标签:;  ;  ;  ;  ;  ;  ;  

相似度算法论文_王直荣,陈章位,张翔,毛晨涛,王宇翔
下载Doc文档

猜你喜欢