导读:本文包含了海明距离论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:距离,海明,模糊,海河,算法,认知,自适应。
海明距离论文文献综述
张宇[1](2018)在《基于海明距离的相似查找索引算法研究》一文中研究指出相似查找问题在信息检索、数据库应用和模式识别等领域都是一个重要的应用。随着网络信息不断增长,数据表现的形式也更加丰富,如何在海量的数据中快速有效地检索出目标信息一直是信息检索领域一项重要研究课题。如何建立高效便捷的索引,在一定时间内返回准确全面的查询结果,是一项具有挑战的热点问题与难点问题。本文主要研究海明空间下的相似查找问题,给定一个数据集D和查询串Q,在尽可能少的时间内返回数据集D中与Q相似的所有字符串,称该问题为相似词典查询问题。相似词典查询问题可以划分为两个阶段来解决:1)Search阶段:利用建好的索引查找出可能相似的目标候选集;2)Check阶段:在这些候选集上运用某种策略进行快速检查,筛选出真正符合查找条件的结果。本文分别在Search阶段和Check阶段进行研究,主要工作内容如下:(1)首先使用Simhash方法完成数据的预处理操作,经过提取、加权、合并和降维等操作将高维数据处理成容易进行相似度比较的Simhash指纹(二进制串)形式。(2)提出基于海明空间的多索引Search算法,主要用于筛选数据集中可能的相似结果候选集。结合基于海明空间的多索引算法的分块建索引的思想,先把二进制指纹化成b个block块,改进的多索引Search算法根据参数k与b之间的关系将多个block块结合在一起建立索引,获得了更好的查询效率。(3)提出两种基于中心点的Check算法,将聚类的思想应用到候选集的筛选策略上,应用于高效筛选Search阶段产生的候选集。基于中心点的贪心Check算法,通过贪心算法选出中心点P,并且每一个中心点P对应一个集群。并将两个基于中心点的Check算法与线性扫描法进行对比实验,得出基于中心点的贪心Check算法具有更好的查询效率。(本文来源于《北京交通大学》期刊2018-06-01)
李元白,曾平飞,杨亚坤,康春花[2](2018)在《一种非参数的多策略方法:多策略的海明距离判别法》一文中研究指出将单策略汉明距离判别法(SS-HDD)拓展至多策略情境(MS-HDD),并通过多因素的模拟设计及与已有研究的比较,考察其精确性与适宜性.研究结果表明:1)MS-HDD构建思路简洁,无需前提假设和参数估计,计算简便;2)单策略情境:MS-HDD与SS-HDD具有等同的判别效果,且判准率均高于相同条件下的广义距离模型(GDD)和多策略广义距离模型(MSCD);3)多策略情境:MS-HDD具有与MSCD相当的PMR和SMR,MS-HDD可适于多策略测验情境.(本文来源于《江西师范大学学报(自然科学版)》期刊2018年01期)
刘颖[3](2017)在《云计算中基于密文的安全最近邻及安全海明距离检索机制》一文中研究指出云计算是继分布式计算、对等计算、网格计算之后出现的一种崭新的计算模式。其核心思想是资源租用、应用托管和服务外包。云具有很高的灵活性和可扩展性,其应用已经愈来愈普及。最近邻查询是数据库中的基础查询之一,在很多领域都有着广阔的应用前景,比如模式识别、机器学习、统计分类等领域。海明距离查询在许多领域都有广泛的应用,比如相似性检测、模式识别、病毒探测、DNA序列和蛋白质分析、错误纠正、文本分类等等。随着云计算和大数据时代的到来,把大规模的数据库外包给云服务器成了趋势,但是云是不完全可信的,其中存在很多潜在的威胁。为了保证数据的安全,用户往往是将数据加密后再存储到云服务器上。如何高效地实现在密文数据上进行最近邻检索和海明距离检索成了迫切需要解决的问题。本论文针对这两个问题分别提出了相应的安全检索协议,具体工作如下:本文首先提出了一种可以用于一维空间和二维空间的的安全最近邻查询方案。该方案的主要思想是把安全最近邻查询问题转化成为判断一个点是否在一个范围内的问题,进而转化成为判断两个集合是否相交的问题,从而可以在安全隐私的状态下进行判断两个集合是否相交的计算。为了达到亚线性级的查询时间,本文提出了一种空间划分方案和范围树的树形数据结构,为了达到可自适应的IND-CPA安全级别,本文提出了多窝布鲁姆过滤器和单窝布鲁姆过滤器,分别用于构建索引和陷门。分析和实验结果验证了所提出方案的有效性。其次,本文提出了一种隐私保护的海明距离查询方案。该方案首先生成一个可逆的随机矩阵,并运用该矩阵对数据进行转换,然后通过前缀编码对数据进行编码,并运用安全数据结构IBF进行存储和安全索引IBTree来构建索引。在安全性方面,可以满足自适应的IND-CKA安全,在查询时间方面,达到了亚线性级的查询时间。分析和实验结果验证了所提出方案的有效性。最后,本文对已完成的研究工作进行了总结,并对下一步的工作进行了展望。(本文来源于《湖南大学》期刊2017-05-05)
李丽颖,苏变萍,张彦博,张飞,张超[4](2016)在《基于海明距离的区间叁角模糊多属性决策问题》一文中研究指出针对属性值为区间叁角模糊数,权重信息不完全的多属性决策问题,为保证决策的准确性,构建了一种基于信息理论思想的决策方法.首先给出区间叁角模糊集(数)的海明距离(Hamming distance)的定义,再利用极大偏差法建立线性规划模型计算属性的权重,最后用TOPSIS方法对方案进行排序,并给出此方法的计算步骤,通过实例验证了该方法的有效性.(本文来源于《数学的实践与认识》期刊2016年17期)
张伟强,王恩元,李学龙,孔祥国,李国爱[5](2016)在《基于海明距离法的煤岩冲击倾向性评价》一文中研究指出针对目前煤岩冲击倾向性评价方法存在的不足,基于海明距离法基本原理,建立了煤岩冲击倾向性综合评价模型。该模型选用动态破坏时间、冲击能量指数、弹性能量指数和煤岩单轴抗压强度作为综合评价指标,应用线性内插公式构造评价对象的隶属函数,采用海明距离法获得评价对象与评价标准的相似程度,并用最小海明距离进行类别评判,从而得出评价结果。实例分析结果表明,海明距离法的评价结果与煤样的实际现场冲击倾向性一致;对处于同一冲击倾向性级别的煤样的海明距离大小进行对比,结果认为海明距离法比模糊综合评判法和熵权-理想点法具有更高的分辨率。(本文来源于《工矿自动化》期刊2016年02期)
徐承爱,林伟,肖红[6](2015)在《一种基于加权海明距离的自适应遗传算法》一文中研究指出针对普通遗传算法易出现早熟收敛和搜索效率低的缺陷,提出一种基于加权海明距离的自适应遗传算法.该算法综合考虑个体间加权海明距离和适应度值,自适应调整交叉概率和变异概率;采用精英保留法,保证最优个体不被破坏;使用双重停机准则,减少不必要的计算时间,提高遗传搜索效率.最后,运用经典测试函数对该算法进行了仿真实验.结果表明,该算法可以显着提高遗传优化的全局搜索能力,加快遗传算法的收敛速度.(本文来源于《华南师范大学学报(自然科学版)》期刊2015年06期)
谭吉玉,朱传喜,张小芝,朱丽[7](2015)在《基于海明距离和TOPSIS的直觉模糊数排序法》一文中研究指出基于直觉模糊数的海明距离,结合传统的TOPSIS思想,给出了直觉模糊数相对于最大直觉模糊数的贴近度公式,贴近度公式即为新的排序函数,新的排序函数能蕴含传统的得分函数和精确函数。基于新的排序指标,利用直觉模糊优先加权平均算子(IFPWA)算出其关联属性权重向量,进而计算各备选方案的集结结果,对最终的集结结果运用新的排序指标进行排序和择优。(本文来源于《统计与决策》期刊2015年19期)
李喻骏[8](2015)在《认知诊断评价中一种简单有效的方法—海明距离判别法》一文中研究指出认知诊断评价(Cognitive Diagnosis Assessment,CDA)使用融合有认知变量的心理计量学模型,对被试的知识结构、加工技能或认知过程进行诊断评估。与经典测量理论(Classical Testing Theory,CTT)和项目反应理论(Item Response Theory,IRT)相比,能够为被试提供更加完整和详细的诊断信息。认知诊断评价所依托的心理计量模型,均是在复杂的统计测量学知识基础上构建的,可以笼统地称之为参数化认知诊断方法。这些方法包含有大量的概率统计、高等数学、线性代数、微积分等知识。对于研究者而言,正确理解并熟练运用并对诊断结果进行科学合理的解释尚且不易,更何况是以上理论基础较薄弱的实践者。此外,参数化的方法依赖于精确的参数估计方法,而参数估计方法本身也存在一定的缺陷。常用的方法如EM算法会收敛到局部最优极值(locallyoptimal extrema),而马尔可夫链蒙特卡洛(Markov Chain Monte Carlo,MCMC)耗时过长,且无法判断是否收敛到真值。以上问题在一定程度上限制了认知诊断的应用和推广。与参数化认知诊断方法相比,非参数化认知诊断方法只需要预先界定好项目属性关联矩阵(即Q矩阵),便可利用被试的观察反应进行诊断分类。其简单、便捷的特点非常适合实际测验情境的需要。本文基于Q矩阵理论,提出一种非参数化认知诊断方法,海明距离判别法(Hamming Distance Discrimination,HDD)。其中,根据判别方式的不同又将其分为R方法和B方法。采用Monte Carlo模拟的研究方法,以模式判准率(Pattern Match Ratio,PMR)和属性平均判准率(Average Attribute Match Ratio,AAMR)作为评价指标,与DINA模型,广义距离判别法(Generalized Distance Discrimination,GDD),以及weighted Hamming distance进行比较。结果表明,海明距离判别法(HDD)具有更简便的操作步骤和十分理想的分类准确率。主要研究结论如下:(1)本文所涉及的五种认知诊断方法均受属性层级结构的紧密程度的影响,属性层级关系越紧密,分类准确率越高。(2)分类准确率由高至低分别为HDD的B方法,DINA模型,HDD的R方法,WH和GDD。其中,HDD的B方法与DINA模型有着同样高的分类准确率。(3)项目数量与认知诊断方法的分类准确率成正比(4)样本容量对认知诊断方法的分类准确率影响较小(5)属性数量与认知诊断方法的分类准确率成反比(6)被试知识状态分布形态为负偏态分布时,上述五种认知诊断方法的分类准确率最高,正态分布其次,均匀分布再次,正偏态分布最低。(本文来源于《江西师范大学》期刊2015-06-01)
杨帅,孙力平,钟远[9](2014)在《基于模糊综合法和海明距离模糊法的水质评价——以海河天津段为例》一文中研究指出根据叶绿素a(Chl.a)和总磷(TP)等水质指标的监测值,采用模糊综合法和海明距离模糊法对海河天津段水质进行了富营养化评价.模糊综合法是通过建立模糊矩阵和权向量,利用最大隶属原则进行评价,突出了主要因子对富营养化的影响;海明距离模糊法是通过构建标准化矩阵和权向量,并综合考虑各评价指标的贡献率,利用最小海明距离原则进行评价,具有很高的分辨率.评价结果表明:前者最大隶属值均值为0.522,属于轻富营养状态,偏向于中富营养状态;后者最小海明距离值(D)均值为0.092,5,属于轻富营养状态;后者更适合于评价海河天津段水质.(本文来源于《天津城建大学学报》期刊2014年05期)
巩固,郝国生,王文虎[10](2014)在《基于海明距离改进的自适应遗传算法》一文中研究指出针对自适应遗传算法在复杂问题应用中前期收敛速度缓慢和容易陷入局部最优解的不足,通过引进种群迁移及增强种群个体杂交之间的海明距离对自适应遗传算法进行了改进.改进的算法提高了种群精英基因,使其能很好地保留到下一代;较好地提高了自适应遗传算法的全局搜索能力,并增强了算法收敛速度.通过仿真实验验证了本文算法的有效性.(本文来源于《江苏师范大学学报(自然科学版)》期刊2014年04期)
海明距离论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
将单策略汉明距离判别法(SS-HDD)拓展至多策略情境(MS-HDD),并通过多因素的模拟设计及与已有研究的比较,考察其精确性与适宜性.研究结果表明:1)MS-HDD构建思路简洁,无需前提假设和参数估计,计算简便;2)单策略情境:MS-HDD与SS-HDD具有等同的判别效果,且判准率均高于相同条件下的广义距离模型(GDD)和多策略广义距离模型(MSCD);3)多策略情境:MS-HDD具有与MSCD相当的PMR和SMR,MS-HDD可适于多策略测验情境.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
海明距离论文参考文献
[1].张宇.基于海明距离的相似查找索引算法研究[D].北京交通大学.2018
[2].李元白,曾平飞,杨亚坤,康春花.一种非参数的多策略方法:多策略的海明距离判别法[J].江西师范大学学报(自然科学版).2018
[3].刘颖.云计算中基于密文的安全最近邻及安全海明距离检索机制[D].湖南大学.2017
[4].李丽颖,苏变萍,张彦博,张飞,张超.基于海明距离的区间叁角模糊多属性决策问题[J].数学的实践与认识.2016
[5].张伟强,王恩元,李学龙,孔祥国,李国爱.基于海明距离法的煤岩冲击倾向性评价[J].工矿自动化.2016
[6].徐承爱,林伟,肖红.一种基于加权海明距离的自适应遗传算法[J].华南师范大学学报(自然科学版).2015
[7].谭吉玉,朱传喜,张小芝,朱丽.基于海明距离和TOPSIS的直觉模糊数排序法[J].统计与决策.2015
[8].李喻骏.认知诊断评价中一种简单有效的方法—海明距离判别法[D].江西师范大学.2015
[9].杨帅,孙力平,钟远.基于模糊综合法和海明距离模糊法的水质评价——以海河天津段为例[J].天津城建大学学报.2014
[10].巩固,郝国生,王文虎.基于海明距离改进的自适应遗传算法[J].江苏师范大学学报(自然科学版).2014