导读:本文包含了相似度公式论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:公式,文档,逻辑,水印,模糊,系统,直觉。
相似度公式论文文献综述
许彩云[1](2019)在《基于文本和公式的科技文档相似度计算研究》一文中研究指出常用的文档相似度计算方法主要包括集合模型方法、向量空间模型方法、潜在语义分析法等,这些方法仅利用文本信息计算文档相似度。然而,科技文档中包含着大量的非文本信息,如公式、图和表,从而使得原有方法已不太适用。本文提出一种基于文本和公式的科技文档相似度计算方法。该方法主要考虑科技文档中的文本和公式信息,在得到文本相似度和文档间公式相似度的基础上,利用线性组合方法得到科技文档相似度。在MREC数据集上的实验结果表明,文本和公式方法在宏平均F1-score(MF)上最大可提高3%。结合公式信息计算科技文档相似度,不仅能有效提高科技文档相似度的准确性,而且可以实现跨语言科技文档的相似度计算。本文的主要工作包括:公式相似度计算方法有很多种,在不考虑公式变量的前提下,本文提出两种公式相似度计算方法。针对基于文本方法中未考虑公式特征元素有序性的问题,提出一种基于特征序列化的公式相似度计算方法。该方法有序提取公式的运算符、常量和括号作为其特征元素,将公式特征元素的位置映射为位置向量,通过计算位置向量是否相等得到公式相似度。针对混合方法中子树的无效匹配问题,提出一种基于有效匹配子树的公式相似度计算方法。该方法首先按先序遍历策略有序获得有效子树多重集,其次利用有效子树父节点的第一个孩子节点的交换性及有效子树是否已被匹配等信息,找到所有的有效匹配子树,最后综合考虑有效匹配子树的节点数和其所在解析树中的层次对有效匹配子树权重的影响,给出有效匹配子树权重计算方法,从而得到公式相似度。实验验证了有效匹配子树方法的有效性。为保证公式的一对一匹配和合理量化文档间公式相似度,提出一种基于KM算法的文档间公式相似度计算方法。该方法利用公式间的相似度,构建文档间公式的带权二部图,采用KM算法求带权二部图的最大权匹配,利用最大权匹配和文档间公式个数计算文档间的公式相似度。(本文来源于《河北大学》期刊2019-06-01)
韩冰,姜合[2](2019)在《基于相似度计算公式改进的K-中心点算法》一文中研究指出在传统K-中心点聚类算法中,相似性一般仅仅用距离来进行度量,这种度量方法均基于对象属性之间是独立同分布的,但大多数真实数据对象属性之间都相关联的,因此,本文将引用非独立同分布计算公式,对传统距离计算相似度方法进行替换。同时,由于此公式会依据属性值的频率来进行计算,但数值型数据对于频率并不敏感,因此,本文在引入公式之前,将数值型数据按属性列进行聚类与替换。实验结果表明,本文方法可以提高算法的聚类精度。(本文来源于《计算机与现代化》期刊2019年05期)
徐建民,许彩云[3](2018)在《基于文本和公式的科技文档相似度计算》一文中研究指出【目的】针对仅利用文本信息计算科技文档相似度存在的不足,提出一种结合文本和公式信息计算科技文档相似度的方法。【方法】将单个公式的特征元素映射为位置向量,计算得到单个公式的相似度;计算文档间的公式覆盖度和相似度;结合文本和公式信息计算得到科技文档相似度。【结果】比较本文方法和传统向量空间方法的分类性能,结果显示本文方法在宏平均F值上最大可提高6.7%。【局限】没有包含文档公式信息的公开测试集,自行构建的数据集规模较小。【结论】结合公式信息计算文档相似度,不仅能有效提高文档相似度计算的准确性,而且可以实现跨语言文档的相似度计算。(本文来源于《数据分析与知识发现》期刊2018年10期)
赵玛瑙[4](2015)在《S-逻辑系统中的积分相似度与对称逻辑公式在L_4~*逻辑度量空间中的分布》一文中研究指出与通常相似度定义在真度基础上不同,本文在S-逻辑系统中提出了基于S-蕴含算子的积分相似度,给出了积分相似度的推理性质.建立了与之相对应的伪距离,证明了伪距离空间(FS(S,)ρ)中逻辑蕴涵算子”(?),∧,∨,→”都是连续的,并研究了S-逻辑系统中的近似推理.在L4*逻辑度量空间中,给出了对称四值R0。函数与对称逻辑公式的定义.通过将对称逻辑公式在L4*逻辑度量空间中的计数问题转化为求解方程的整数解的个数问题,使用MATLAB实现了方程的整数解,从而解决了对称逻辑公式在L4*逻辑度量空间中的计数问题.证明了3n,3n+1,3n+2元对称逻辑公式在L4*中的计数公式.通过具体的例子,给出两种方法实现了对称逻辑公式在L4*逻辑度量空间中的个数问题,得出了相同的结果,证明了结论的正确性.得出了n元对称逻辑公式占全体n元逻辑公式的比例随着n的增大而趋于0;论证了对称逻辑公式的真度之集在[0,1]中稠密.(本文来源于《延安大学》期刊2015-06-01)
王曼[5](2015)在《相似度公式的改进及其在医疗诊断系统中的应用》一文中研究指出两直觉模糊集之间的相似度测量作为模糊集的重要专题,已经引起了许多学者的重视与研究,提出了很多度量公式,但在部分公式中会存在反直觉缺陷,并不能满足所有的客观条件。2014年土耳其学者Boran和Akay提出了一种新的基于双参数的相似度测量公式,改进了主流公式中存在的一些模式识别失灵问题,然而,在他们引入的一个与成员隶属度和非成员隶属度取值对应的等腰直角叁角形区域中,所提出的公式的取值只能涉及最特殊的一条线段——斜边中线,鉴于此本文对这个公式做出了进一步改进,从叁个不同的方向提出叁个测量公式,将公式所涉及的范围延伸到整个叁角形区域中,从而将公式的适用范围一般化。在文章的后半部分,将给出一个医疗诊断系统,该诊断系统旨在起到辅助诊断的作用。首先根据疾病的各种病症提取病人的数据,然后整理成病症的直觉模糊集数据,之后与标准疾病模型数据进行比较计算。这里的计算是利用直觉模糊集相似度公式进行的,从计算中我们可以得出病人和标准模型的相似程度。如果两者很大程度相似,我们就可以得出病人得这种病的可能性很大,应该进行下一步检查;如果两者几乎不相似,就可以排除病人得此病的可能。除此之外,该诊断系统将原公式与改进后的进行对比,通过系统显示的数据,可以清楚看出改进后的公式在诊断疾病时的优越性。此系统为医学诊断系统的发展提供了一个新的切入角度,旨在减少医生工作量的同时,提高诊断的实时性和正确率。(本文来源于《西北师范大学》期刊2015-05-01)
唐亚伟[6](2013)在《公式相似度算法及其在论文查重中的应用研究》一文中研究指出随着信息技术的发展以及互联网的普及,人们获取信息的方式越来越便利。为了更加方便、快捷地共享与交流新的学术研究成果,学术资源网络化已经成为发展趋势,但网络学术资源的共享性质以及获取成本的降低,使得抄袭、剽窃等不道德行为日益增多。文本形式的数字化学术论文是网络学术资源的重要组成部分,为了防止文本的非法复制与抄袭,文本复制检测技术已成为研究热点,给学术论文文本查重提供了方法,并且取得了很大进展,但对图像、图表、公式等非文本类元素的复制检测技术尚处于起步阶段,有待进一步的研究。本文首先阐述了复制检测技术,分析了现有复制检测系统的处理方式。其次,分析了文本、源码复制检测与公式复制检测的特点,提出一种基于二叉树结构的LaTeX格式数学表达式匹配算法,首先根据数学公式的LaTeX格式生成其二叉树表示,并对树形结构作归一化处理,然后先序遍历二叉树并对变量名作归一化处理,最后根据对应位相同的公式元素计算两个公式的相似度。在此基础上,提出了一种数学公式抄袭检测算法。首先生成待检测数学公式的二叉树表示及结构码,然后在与结构码同名的表中查找记录,计算相似度,最后根据阀值确定是否为抄袭。实验结果表明,该算法准确地实现了数学公式的抄袭检测,是一种较实用的算法。(本文来源于《渤海大学》期刊2013-04-01)
梁霞,魏翠萍,郭丽彬[7](2012)在《一个新的相似度公式及其在群决策中的应用》一文中研究指出利用熵和相似度的关系建立了一个新的直觉模糊集的相似度公式.针对专家权重完全未知的直觉模糊多属性群决策问题,定义了正理想矩阵、负理想矩阵和平均矩阵,根据个体决策矩阵与正、负理想矩阵和平均矩阵的相似程度对专家进行赋权,并由此建立了一种直觉模糊多属性群决策方法.(本文来源于《曲阜师范大学学报(自然科学版)》期刊2012年01期)
隋云云[8](2011)在《逻辑系统L_4~2中公式的相似度》一文中研究指出基于非线性序集逻辑系统L24中的真度概念,给出了公式的相似度概念,并给出了一些基本性质,为进一步建立该系统中的近似推理理论奠定了基础。(本文来源于《潍坊学院学报》期刊2011年04期)
李黎,阮留照[9](2011)在《一种合理的数字水印相似度评价公式》一文中研究指出针对当前常用的评价水印相似度的公式存在较大的缺陷——相似度为1时水印信息不唯一。该文分析了常用的相似度公式存在的问题和其合理性,提出了一个结合向量长度的水印相似度的新评价公式。该公式不仅可以从理论上解决相似度为1的不唯一性问题,而且实验结果证明具有较好的视觉评价一致性。(本文来源于《杭州电子科技大学学报》期刊2011年03期)
何冰[10](2010)在《水印技术中相似度公式的一种改进算法》一文中研究指出目前国内外在评价数字水印技术中水印的相似程度主要采用的是归一化相关值(Normalized Correlation值),尽管常见的几种归一化相关值公式可以客观的表示原始水印与提取水印的相似程度,但如果要从人类视觉的主观角度出发,这些传统的归一化相关值公式在表示提取出的水印和原始水印反面相似时会存在很大不足。为此,提出了一种基于图像像素均值的数字水印相似程度的评价公式,文章称之为均值相关值。使用均值相关值公式可以有效的继承传统的归一化相关值,并克服了这些传统评价相似度的不足。通过仿真实验证明文章构建的均值相关值公式具有很好的科学性、合理性和有效性。(本文来源于《计算机与数字工程》期刊2010年10期)
相似度公式论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在传统K-中心点聚类算法中,相似性一般仅仅用距离来进行度量,这种度量方法均基于对象属性之间是独立同分布的,但大多数真实数据对象属性之间都相关联的,因此,本文将引用非独立同分布计算公式,对传统距离计算相似度方法进行替换。同时,由于此公式会依据属性值的频率来进行计算,但数值型数据对于频率并不敏感,因此,本文在引入公式之前,将数值型数据按属性列进行聚类与替换。实验结果表明,本文方法可以提高算法的聚类精度。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
相似度公式论文参考文献
[1].许彩云.基于文本和公式的科技文档相似度计算研究[D].河北大学.2019
[2].韩冰,姜合.基于相似度计算公式改进的K-中心点算法[J].计算机与现代化.2019
[3].徐建民,许彩云.基于文本和公式的科技文档相似度计算[J].数据分析与知识发现.2018
[4].赵玛瑙.S-逻辑系统中的积分相似度与对称逻辑公式在L_4~*逻辑度量空间中的分布[D].延安大学.2015
[5].王曼.相似度公式的改进及其在医疗诊断系统中的应用[D].西北师范大学.2015
[6].唐亚伟.公式相似度算法及其在论文查重中的应用研究[D].渤海大学.2013
[7].梁霞,魏翠萍,郭丽彬.一个新的相似度公式及其在群决策中的应用[J].曲阜师范大学学报(自然科学版).2012
[8].隋云云.逻辑系统L_4~2中公式的相似度[J].潍坊学院学报.2011
[9].李黎,阮留照.一种合理的数字水印相似度评价公式[J].杭州电子科技大学学报.2011
[10].何冰.水印技术中相似度公式的一种改进算法[J].计算机与数字工程.2010