导读:本文包含了相似度计算论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:向量,语义,文本,句子,贝尔,形状,拉普拉斯。
相似度计算论文文献综述
孙洪迪[1](2019)在《基于Word2Vec的高效词汇语义相似度计算系统的设计实现》一文中研究指出随着计算机软硬件技术和人工智能技术的飞速发展,计算机人工智能技术在我国各领域的应用也越来越广泛,自然语言处理领域的人工智能技术也得到了前所未有的发展。在对Word2Vec开源库进行深入研究后,就其词汇语义相似度算法提出优化解决方案,提高了词汇语义相似度计算效率及准确率,并给出了优化后的实际测试结果。(本文来源于《北京工业职业技术学院学报》期刊2019年04期)
翟社平,李兆兆,段宏宇,李婧,董迪迪[2](2019)在《基于词法、句法和语义的句子相似度计算方法》一文中研究指出为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF叁元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.(本文来源于《东南大学学报(自然科学版)》期刊2019年06期)
张敏[3](2019)在《短文本语义相似度计算研究》一文中研究指出文本相似度在同义词测试、信息抽取、文本分类、机器翻译等自然语言处理领域有着广泛的应用。在网络信息爆炸的今天,大量可用的信息如科学文献的摘要、说明、产品描述等以短文本形式呈现。当前关注大文件或独立词的相似度计算方法在短文本上的效果欠佳。对此提出一种短文本相似度计算方法,基于向量的余弦相似基线,使用一种将词与词之间的相似性和词的特异性指标结合到一起的方法来达到最佳的性能,在数据集上进行的实验表明,语义相似度方法优于基于简单词汇匹配的方法,其整体精确度提高,误差率显着降低。(本文来源于《微型电脑应用》期刊2019年10期)
朱玲,李敬华,胡钦谙,杨峰[4](2019)在《基于词向量计算的中医症状术语相似度研究》一文中研究指出研究针对中医临床症状词描述的差异与分歧,以Word2vec和FastText为工具,基于现有中医药语料库,进行中医症状相似度研究,发现了一些较为晦涩、生僻的症状同义词及近义词,扩充了中医症状词的词表,并通过对Pearson、Spearman系数,以及召回率的比较,认为FastText在这一任务上有更好的表现。但是由于中文分词,特别是中医古籍分词的先天劣势,以及现有语料不够丰富,导致召回率和准确率还有很大的提升空间,未来值得进一步研究。(本文来源于《中国数字医学》期刊2019年10期)
徐鑫鑫,刘彦隆,宋明[5](2019)在《利用加权词句向量的文本相似度计算方法》一文中研究指出传统词游走距离算法基于word2vec词向量以及词频特征向量计算文档距离,存在忽略词语语义的上下文语境以及无法充分提取词语中的语义信息等问题.因此,本文提出一种基于联合词句的文本相似度计算方法.该方法利用训练好的词向量和句向量构建特征权重系数,对词游走距离计算公式进行改进后,选取一定比例关键词的词向量与句向量计算词句转移成本,从而得到文档的文本相似度.通过叁组对比实验表明,该方法的效果优于其他文本相似度计算方法和原始词游走距离算法.(本文来源于《小型微型计算机系统》期刊2019年10期)
郑明明,林志毅[6](2019)在《基于双调合距离的叁维形状相似度计算方法》一文中研究指出基于双调和距离的等距不变性,提出一种叁维形状的相似性度量方法。给出双调和距离、形式化表达和离散计算的定义,并对形状的双调和距离矩阵进行奇异值分解。提取双调和距离矩阵的特征值作为形状描述符,将一对形状特征值的余弦距离作为形状相似度。通过TOSCA2010数据库上的实验结果表明,与FMPS方法、SHED方法相比,该方法能够较好地兼顾时间耗费度和形状匹配度。(本文来源于《计算机工程》期刊2019年10期)
翟社平,李兆兆,段宏宇,李婧,董迪迪[7](2019)在《多特征融合的句子语义相似度计算方法》一文中研究指出针对句子语义相似度计算问题,综合考虑句子的结构信息与语义信息,提出一种多特征融合的句子语义相似度计算方法。提取句子的词形特征、词序特征及句长特征,使用层次分析法进行权重分配,计算结构相似度;利用本体图中最短路径定义语义距离,基于语义距离计算句子语义相似度;对结构相似度和语义相似度进行特征加权,构建多特征融合的句子语义相似度计算方法。实验结果表明,该方法取得了72.5%的F-度量值,与传统余弦相似度和基于关键词的相似度算法相比提高了12%。(本文来源于《计算机工程与设计》期刊2019年10期)
张波[8](2019)在《基于维基百科链接特征的词语语义相似度计算》一文中研究指出针对目前基于维基百科的相似度计算方法预处理过程烦琐、计算量大的问题,本文以维基百科为本体引入基于特征的词语语义计算,提出了一种基于维基百科的快速词语相似度计算方法。根据维基百科页面链接结构的特点,该方法把页面的入链接和出链接作为页面特征值构建特征向量模型,通过计算页面的特征向量相关系数计算对应词语的语义相似度。本文还改进了维基百科消歧处理算法,在一词多义的处理中减少社会认知度低的义项页面的干扰,进一步提高了计算准确度。经Miller&Charles(MC30)和Rubenstein&Goodenough(RG65)测试集的测试,测试结果表明了基于维基百科链接特征的方法在计算相似度方面的可行性,也验证了本文的计算策略和消歧改进算法的合理性。(本文来源于《软件工程》期刊2019年10期)
曹建文,万福成[9](2019)在《面向自动问答系统的问句相似度计算研究》一文中研究指出结构化自动问答系统采用传统方法缺少对词汇、词序和结构的划分,导致语句相似度较低,为了解决该问题,提出了基于Web语义的混合问句相似度计算方法。根据结构化自动问答系统结构,设计系统语句分析模型,通过正向匹配方法,对模型专业词库中的用户输入自然语句进行分词处理,并对字符串之间的关系展开分析。采用非恒定相似度系数来描述2个字符串的相似情况,并由此分析词形、词序和结构相似度,完成不同语句相似度的计算。通过实验对比可知,文章提出的基于Web语义的混合问句相似度计算方法最高计算精准度可达到96%,可提升自动问答系统的整体性能。(本文来源于《重庆大学学报》期刊2019年09期)
刘一丁,陈晓琳,尹晓阳,刘功申[10](2019)在《资源贫乏型语言间文本相似度计算方法》一文中研究指出文本相似度计算是自然语言处理领域的研究热点和难点。自2013年"一带一路"倡议提出以来,我国急需小语种国家和地区的商业情报信息。选取中文和藏文进行比较,并采用基于多级双语向量空间映射技术的文本相似度算法计算藏汉文本相似度。首先,对文本进行预处理,并对中文文本和藏文文本进行分词;然后,利用多级双语向量空间映射框架,将藏文词向量和中文词向量映射到同一抽象的语义空间下,词间相似度则由映射后的词向量计算得出;最后,计算得出基于词间相似度的文本相似度。利用已训练完毕的汉藏词向量得到最佳多级框架,再选择6个类别的中文和藏文新闻作为试验数据,配以映射后的汉藏词向量计算汉藏文本相似度。试验结果表明,该方法可通过相似度结果有效区分同类别和异类别新闻。(本文来源于《指挥信息系统与技术》期刊2019年04期)
相似度计算论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF叁元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
相似度计算论文参考文献
[1].孙洪迪.基于Word2Vec的高效词汇语义相似度计算系统的设计实现[J].北京工业职业技术学院学报.2019
[2].翟社平,李兆兆,段宏宇,李婧,董迪迪.基于词法、句法和语义的句子相似度计算方法[J].东南大学学报(自然科学版).2019
[3].张敏.短文本语义相似度计算研究[J].微型电脑应用.2019
[4].朱玲,李敬华,胡钦谙,杨峰.基于词向量计算的中医症状术语相似度研究[J].中国数字医学.2019
[5].徐鑫鑫,刘彦隆,宋明.利用加权词句向量的文本相似度计算方法[J].小型微型计算机系统.2019
[6].郑明明,林志毅.基于双调合距离的叁维形状相似度计算方法[J].计算机工程.2019
[7].翟社平,李兆兆,段宏宇,李婧,董迪迪.多特征融合的句子语义相似度计算方法[J].计算机工程与设计.2019
[8].张波.基于维基百科链接特征的词语语义相似度计算[J].软件工程.2019
[9].曹建文,万福成.面向自动问答系统的问句相似度计算研究[J].重庆大学学报.2019
[10].刘一丁,陈晓琳,尹晓阳,刘功申.资源贫乏型语言间文本相似度计算方法[J].指挥信息系统与技术.2019