导读:本文包含了海明距离论文开题报告文献综述及选题提纲参考文献,主要关键词:相似查找,多索引,海明距离,Simhash
海明距离论文文献综述
张宇[1](2018)在《基于海明距离的相似查找索引算法研究》一文中研究指出相似查找问题在信息检索、数据库应用和模式识别等领域都是一个重要的应用。随着网络信息不断增长,数据表现的形式也更加丰富,如何在海量的数据中快速有效地检索出目标信息一直是信息检索领域一项重要研究课题。如何建立高效便捷的索引,在一定时间内返回准确全面的查询结果,是一项具有挑战的热点问题与难点问题。本文主要研究海明空间下的相似查找问题,给定一个数据集D和查询串Q,在尽可能少的时间内返回数据集D中与Q相似的所有字符串,称该问题为相似词典查询问题。相似词典查询问题可以划分为两个阶段来解决:1)Search阶段:利用建好的索引查找出可能相似的目标候选集;2)Check阶段:在这些候选集上运用某种策略进行快速检查,筛选出真正符合查找条件的结果。本文分别在Search阶段和Check阶段进行研究,主要工作内容如下:(1)首先使用Simhash方法完成数据的预处理操作,经过提取、加权、合并和降维等操作将高维数据处理成容易进行相似度比较的Simhash指纹(二进制串)形式。(2)提出基于海明空间的多索引Search算法,主要用于筛选数据集中可能的相似结果候选集。结合基于海明空间的多索引算法的分块建索引的思想,先把二进制指纹化成b个block块,改进的多索引Search算法根据参数k与b之间的关系将多个block块结合在一起建立索引,获得了更好的查询效率。(3)提出两种基于中心点的Check算法,将聚类的思想应用到候选集的筛选策略上,应用于高效筛选Search阶段产生的候选集。基于中心点的贪心Check算法,通过贪心算法选出中心点P,并且每一个中心点P对应一个集群。并将两个基于中心点的Check算法与线性扫描法进行对比实验,得出基于中心点的贪心Check算法具有更好的查询效率。(本文来源于《北京交通大学》期刊2018-06-01)
李元白,曾平飞,杨亚坤,康春花[2](2018)在《一种非参数的多策略方法:多策略的海明距离判别法》一文中研究指出将单策略汉明距离判别法(SS-HDD)拓展至多策略情境(MS-HDD),并通过多因素的模拟设计及与已有研究的比较,考察其精确性与适宜性.研究结果表明:1)MS-HDD构建思路简洁,无需前提假设和参数估计,计算简便;2)单策略情境:MS-HDD与SS-HDD具有等同的判别效果,且判准率均高于相同条件下的广义距离模型(GDD)和多策略广义距离模型(MSCD);3)多策略情境:MS-HDD具有与MSCD相当的PMR和SMR,MS-HDD可适于多策略测验情境.(本文来源于《江西师范大学学报(自然科学版)》期刊2018年01期)
邬晓光,贺攀,苏兴矩,钱若霖[3](2017)在《基于海明距离-TOPSIS法的山区公路隧道扩建方案直觉模糊优选》一文中研究指出为了解决山区高速公路隧道改扩建方案选取决策困难而又缺乏理论依据的问题,基于直觉模糊数的海明距离,结合TOPSIS方法,增加专家权向量修正,进而得到处理具有优先级别关系的多属性问题的决策方法。分析山区高速公路隧道改扩建的影响因素,建立隧道扩建方案影响指标体系。从依托工程实际出发,邀请指定的专家对指标优先级别排序,然后利用已建的数学模型实现扩建方案寻优。该方法在厦蓉高速公路隧道改扩建施工方案优选中得到有效运用,说明该方法实用可行,对隧道改扩建施工方案以及类似工程方案优选问题具有重要的指导意义。(本文来源于《隧道建设》期刊2017年08期)
康春花,杨亚坤,曾平飞[4](2017)在《海明距离判别法分类准确率的影响因素》一文中研究指出为探讨海明距离判别法(HDD)的非参数优势,通过一个5因素混合实验,考察了4个因素(属性层级、测验长度、样本容量、知识状态分布)对HDD的3种判别方法(R方法、B方法、W方法)分类准确率的影响.结果表明:1)属性层级和测验长度均会影响HDD判准率,属性层级越紧密、测验长度越长,HDD判准率越高;2)HDD对样本容量无依赖,可适于小样本评估;3)HDD的R方法、B方法、W方法的分类准确率无差异;4)HDD无需被试知识状态分布的正态性假设,更适于均匀分布.(本文来源于《江西师范大学学报(自然科学版)》期刊2017年04期)
刘颖[5](2017)在《云计算中基于密文的安全最近邻及安全海明距离检索机制》一文中研究指出云计算是继分布式计算、对等计算、网格计算之后出现的一种崭新的计算模式。其核心思想是资源租用、应用托管和服务外包。云具有很高的灵活性和可扩展性,其应用已经愈来愈普及。最近邻查询是数据库中的基础查询之一,在很多领域都有着广阔的应用前景,比如模式识别、机器学习、统计分类等领域。海明距离查询在许多领域都有广泛的应用,比如相似性检测、模式识别、病毒探测、DNA序列和蛋白质分析、错误纠正、文本分类等等。随着云计算和大数据时代的到来,把大规模的数据库外包给云服务器成了趋势,但是云是不完全可信的,其中存在很多潜在的威胁。为了保证数据的安全,用户往往是将数据加密后再存储到云服务器上。如何高效地实现在密文数据上进行最近邻检索和海明距离检索成了迫切需要解决的问题。本论文针对这两个问题分别提出了相应的安全检索协议,具体工作如下:本文首先提出了一种可以用于一维空间和二维空间的的安全最近邻查询方案。该方案的主要思想是把安全最近邻查询问题转化成为判断一个点是否在一个范围内的问题,进而转化成为判断两个集合是否相交的问题,从而可以在安全隐私的状态下进行判断两个集合是否相交的计算。为了达到亚线性级的查询时间,本文提出了一种空间划分方案和范围树的树形数据结构,为了达到可自适应的IND-CPA安全级别,本文提出了多窝布鲁姆过滤器和单窝布鲁姆过滤器,分别用于构建索引和陷门。分析和实验结果验证了所提出方案的有效性。其次,本文提出了一种隐私保护的海明距离查询方案。该方案首先生成一个可逆的随机矩阵,并运用该矩阵对数据进行转换,然后通过前缀编码对数据进行编码,并运用安全数据结构IBF进行存储和安全索引IBTree来构建索引。在安全性方面,可以满足自适应的IND-CKA安全,在查询时间方面,达到了亚线性级的查询时间。分析和实验结果验证了所提出方案的有效性。最后,本文对已完成的研究工作进行了总结,并对下一步的工作进行了展望。(本文来源于《湖南大学》期刊2017-05-05)
陈亚胜,何启龙,贺攀[6](2017)在《基于海明距离的高速公路改扩建典型工程的预算贴近度评价》一文中研究指出根据内蒙古自治区和邻近省份已建高速公路改扩建工程建设费用的统计调查结果,并采用区间数表示改扩建工程各项费用比例,提出了内蒙古自治区高速公路改扩建工程项目费用贴近度评定等级及标准。以乌新高速公路改扩建典型工程为例,通过单项评价及综合评价计算典型工程费用比例的贴近度,确定其典型工程项目费用的合理性。通过实例验证,采用贴近度评定方法可以判断高速公路改扩建工程预算的合理性。(本文来源于《公路》期刊2017年03期)
李丽颖,苏变萍,张彦博,张飞,张超[7](2016)在《基于海明距离的区间叁角模糊多属性决策问题》一文中研究指出针对属性值为区间叁角模糊数,权重信息不完全的多属性决策问题,为保证决策的准确性,构建了一种基于信息理论思想的决策方法.首先给出区间叁角模糊集(数)的海明距离(Hamming distance)的定义,再利用极大偏差法建立线性规划模型计算属性的权重,最后用TOPSIS方法对方案进行排序,并给出此方法的计算步骤,通过实例验证了该方法的有效性.(本文来源于《数学的实践与认识》期刊2016年17期)
张伟强,王恩元,李学龙,孔祥国,李国爱[8](2016)在《基于海明距离法的煤岩冲击倾向性评价》一文中研究指出针对目前煤岩冲击倾向性评价方法存在的不足,基于海明距离法基本原理,建立了煤岩冲击倾向性综合评价模型。该模型选用动态破坏时间、冲击能量指数、弹性能量指数和煤岩单轴抗压强度作为综合评价指标,应用线性内插公式构造评价对象的隶属函数,采用海明距离法获得评价对象与评价标准的相似程度,并用最小海明距离进行类别评判,从而得出评价结果。实例分析结果表明,海明距离法的评价结果与煤样的实际现场冲击倾向性一致;对处于同一冲击倾向性级别的煤样的海明距离大小进行对比,结果认为海明距离法比模糊综合评判法和熵权-理想点法具有更高的分辨率。(本文来源于《工矿自动化》期刊2016年02期)
徐承爱,林伟,肖红[9](2015)在《一种基于加权海明距离的自适应遗传算法》一文中研究指出针对普通遗传算法易出现早熟收敛和搜索效率低的缺陷,提出一种基于加权海明距离的自适应遗传算法.该算法综合考虑个体间加权海明距离和适应度值,自适应调整交叉概率和变异概率;采用精英保留法,保证最优个体不被破坏;使用双重停机准则,减少不必要的计算时间,提高遗传搜索效率.最后,运用经典测试函数对该算法进行了仿真实验.结果表明,该算法可以显着提高遗传优化的全局搜索能力,加快遗传算法的收敛速度.(本文来源于《华南师范大学学报(自然科学版)》期刊2015年06期)
谭吉玉,朱传喜,张小芝,朱丽[10](2015)在《基于海明距离和TOPSIS的直觉模糊数排序法》一文中研究指出基于直觉模糊数的海明距离,结合传统的TOPSIS思想,给出了直觉模糊数相对于最大直觉模糊数的贴近度公式,贴近度公式即为新的排序函数,新的排序函数能蕴含传统的得分函数和精确函数。基于新的排序指标,利用直觉模糊优先加权平均算子(IFPWA)算出其关联属性权重向量,进而计算各备选方案的集结结果,对最终的集结结果运用新的排序指标进行排序和择优。(本文来源于《统计与决策》期刊2015年19期)
海明距离论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
将单策略汉明距离判别法(SS-HDD)拓展至多策略情境(MS-HDD),并通过多因素的模拟设计及与已有研究的比较,考察其精确性与适宜性.研究结果表明:1)MS-HDD构建思路简洁,无需前提假设和参数估计,计算简便;2)单策略情境:MS-HDD与SS-HDD具有等同的判别效果,且判准率均高于相同条件下的广义距离模型(GDD)和多策略广义距离模型(MSCD);3)多策略情境:MS-HDD具有与MSCD相当的PMR和SMR,MS-HDD可适于多策略测验情境.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
海明距离论文参考文献
[1].张宇.基于海明距离的相似查找索引算法研究[D].北京交通大学.2018
[2].李元白,曾平飞,杨亚坤,康春花.一种非参数的多策略方法:多策略的海明距离判别法[J].江西师范大学学报(自然科学版).2018
[3].邬晓光,贺攀,苏兴矩,钱若霖.基于海明距离-TOPSIS法的山区公路隧道扩建方案直觉模糊优选[J].隧道建设.2017
[4].康春花,杨亚坤,曾平飞.海明距离判别法分类准确率的影响因素[J].江西师范大学学报(自然科学版).2017
[5].刘颖.云计算中基于密文的安全最近邻及安全海明距离检索机制[D].湖南大学.2017
[6].陈亚胜,何启龙,贺攀.基于海明距离的高速公路改扩建典型工程的预算贴近度评价[J].公路.2017
[7].李丽颖,苏变萍,张彦博,张飞,张超.基于海明距离的区间叁角模糊多属性决策问题[J].数学的实践与认识.2016
[8].张伟强,王恩元,李学龙,孔祥国,李国爱.基于海明距离法的煤岩冲击倾向性评价[J].工矿自动化.2016
[9].徐承爱,林伟,肖红.一种基于加权海明距离的自适应遗传算法[J].华南师范大学学报(自然科学版).2015
[10].谭吉玉,朱传喜,张小芝,朱丽.基于海明距离和TOPSIS的直觉模糊数排序法[J].统计与决策.2015