导读:本文包含了数据库匹配算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数据库,算法,水印,模式,函数,频率,部类。
数据库匹配算法论文文献综述
王荣华[1](2019)在《基于概率的图数据库匹配优化算法研究》一文中研究指出资源描述框架广泛用于描述资源及其关系,资源描述框架图是最常用的资源描述框架数据表示方式之一.采用不一致概率的资源描述框架图对数据进行形式化处理,并探讨图匹配问题.给定查询图,从不一致概率的资源描述框架图中进行子图的检索,并获得高质量分数.为了提高查询效率,设计了一个有效的剪枝策略.通过大量的实验验证了所提出算法的有效性.(本文来源于《西安文理学院学报(自然科学版)》期刊2019年04期)
杨航,侯琼煌[2](2015)在《基于Q-Gram的数据库模式匹配算法》一文中研究指出模式匹配是数据集成的重要步骤之一,而数据库异构、数据量大等特点是匹配的难点所在。在梳理模式匹配概念和研究现状的基础上,提出一种基于Q-Gram数据库模式匹配算法,通过对实例数据进行切分,计算域之间的相似度,得到域的语义匹配度。该算法具有线性的时间复杂度,实验显示其能给出较为精确的匹配结果。(本文来源于《信息技术》期刊2015年08期)
纪亚洲,顾和和,李保杰[3](2015)在《国土数据库变更中公共边自动匹配算法研究》一文中研究指出针对国土数据库变更传统方法中存在的公共边处理效率低下现状,提出一种基于多因素综合评价模型与最小二乘原理的公共边自动识别与匹配算法.从几何与拓扑的角度选择空间位置、欧氏距离、空间走向以及拓扑关系作为公共边相似性评价的指标体系;采用多因素综合评价模型对公共边的相似性进行评价;以所识别的公共边同名点为基础,基于最小二乘原理实现公共边的自动转换与匹配.实验结果表明:所提出的公共边识别与匹配算法具有良好的稳定性及较高的识别能力,可以有效解决非1∶1关系公共边识别与匹配问题,提高国土数据库的更新效率.(本文来源于《中国矿业大学学报》期刊2015年02期)
马瑞敏,陈继红[4](2012)在《基于二维空间元素匹配的数据库水印算法》一文中研究指出针对现有数据库水印算法对原始数据修改量大、水印信息隐蔽性差的问题,提出一种基于二维空间元素匹配的关系数据库鲁棒水印算法。算法选取数据库主键的Hash值作为元组的定位空间,选取数值属性冗余位作为元组的数据空间,构建了一个二维空间。通过调整二维空间对应元素的奇偶性嵌入水印信息。实验中嵌入水印前后载体数据均值变化0.5296×10-2%,方差变化0.650 9×10-4%,表明该算法对原始数据修改量小,水印隐蔽性好,鲁棒性强。(本文来源于《计算机应用》期刊2012年08期)
黄博[5](2012)在《图数据库中多子图匹配查询算法研究》一文中研究指出图数据库是一种以图论为理论基础,描述并存储图中节点及其之间的关系的特定数据库。图数据库在处理大规模复杂、半结构化或无结构数据时具有独特的优势,是数据库领域的热门研究课题。子图匹配作为图数据库的一个基本问题得到了学术界广泛关注,但现有算法大多以单个查询作为研究对象并进行优化。随着图数据库在社交网络、生物信息等领域的广泛应用,多查询处理成为图数据库的一个重要研究方向。本文研究多子图匹配查询问题,针对图数据库和查询序列两种数据源,提出一种双重索引结构。一方面基于数据库的频繁子项建立数据库索引,另一方面基于查询序列的子图建立查询索引,并利用子项的包含关系建立两种索引的关联,将一段时间的查询子图及匹配信息存储在查询索引中,进而利用历史查询中分步子图,提高结构相似的查询处理速度。该方法结合图的编码技术和存储映射技术,支持索引的快速随机访问,其查询索引结构能够快速更新,并使用双向检索的方法快速查找匹配集合。通过实验和现有的经典算法进行比较,验证了算法的效果,证实了算法的实用性。(本文来源于《复旦大学》期刊2012-04-10)
丁国辉[6](2011)在《数据库模式匹配算法的研究》一文中研究指出模式匹配被广泛应用于数据库相关领域中,例如数据集成、数据空间、DeepWeb、数据仓库、以及本体合并等。针对模式匹配的研究已有几十年的历史,从早期的手工完成匹配操作到目前的自动发现匹配,人们已经取得了很多研究成果。给定源模式和目标模式,模式匹配的目标是发现两个模式间元素的对应关系,具有对应关系的元素表示相同或者相似的语义。由于模式匹配的发现是一个利用已有知识对元素语义进行挖掘和理解的过程,所以其在一定程度上相当于自然语言处理,这也体现了模式匹配固有的困难性。因此,为进一步提高模式匹配的质量,人们仍需要更多的关于模式匹配的研究。近些年,随着互联网的发展以及通讯工具的普及,人们对数据共享和交换的需求越来越强烈,这也使得模式匹配问题成为目前的研究热点。所以针对模式匹配的研究不但具有理论意义而且具有实际应用基础。本文从数据库的查询日志中为属性提取可用于匹配的统计信息,并以此为基础,提出一些模式匹配的发现及改进算法。同时,本文对模式匹配在模式集成领域中的应用进行了研究,提出了基于用户偏好的多模式产生算法。本文主要针对关系模式的匹配问题进行探讨,具体研究工作如下:(1)匹配的发现首先,本文利用属性的出现频率来发现匹配。通过日志中每个属性在相应查询子句中的出现频率构建特征向量。采用聚类技术对不同属性的特征向量进行分组,处在同一聚类中的属性则具有相同或者相似的语义。为进一步提高聚类结果的准确性,通过最大相似性阈值来发现聚类中语义异常的属性,并设计了异常属性去除算法。实验结果表明所提出的方法具有较高的准确率。其次,本文利用属性在查询结果的模式结构中的出现顺序发现匹配。本文方法包含叁个阶段。第一,从查询日志中抽取出现序列,并对属性在这些出现序列中的出现顺序进行统计。第二,利用矩阵对属性出现顺序的统计信息进行组织。第叁,针对具有不同基数的映射,采用两种打分函数度量不同输入模式统计信息矩阵间的相似性,并采用模拟退火算法寻找最优映射。实验结果表明所提出的方法能返回较准确的匹配。最后,本文利用日志中关于SQL语句内容和结构的统计信息进行模式匹配。本文方法包括四个阶段。第一阶段对SQL语句的子句进行统计,并构建子句关联图cag。其次,利用cag构建“匹配对”集合,每个匹配对表示一对属性序列。第叁,度量匹配对的两种相似性,即属性(property)相似性和结构相似性。最后,设计两种将匹配对分解成单一匹配的算法,并利用阈值策略选择最优匹配。实验结果表明基于查询语句的匹配方法是有效的、准确的。(2)匹配的改进针对匹配不能适应数据实例包含分类的情况,本文提出模式匹配的改进算法。从源模式的数据实例中发现隐含的分类语义,并将其与匹配进行关联以提高匹配的质量。本文方法包含叁个阶段。首先,通过聚类技术发现源实例中的可能分类。其次,通过信息熵技术去除干扰属性得到真正的分类属性。最后,通过引入一个称为c-mapping的概念实现分类语义和匹配间的关联。实验结果表明本文方法具有较好的性能。(3)匹配的应用模式匹配的最终目标是解决实际问题。所以本文对模式匹配在模式集成中的应用进行了研究,提出一种基于用户偏好的自动的模式集成方法。通过引入一个称为参考模式的概念将用户偏好实例化。参考模式能够导向集成过程根据用户偏好产生中间模式(集成模式)。本文通过属性密度方法测量候选模式与标准模式间的相似性。在此基础上,设计一个top-k排序算法用于找到k用户真正需要的中间模式作为算法最后的输出。实验结果表明本文方法具有较高的效率。(本文来源于《东北大学》期刊2011-11-04)
金延红,张国煊[7](2010)在《关于数据库清理的一种模糊匹配算法》一文中研究指出由于数据来源复杂,日积月累,数据库中有很多重复数据。在"电话号码"和"手机号码"字段数据中,不单单只有号码,还有汉字等,有的记录甚至有二叁个号码;本文根据以上实际情况,提出了一种查出"重复"数据的模糊匹配算法,算法的基本思路是:从记录中,单单取出数字号码,然后进行比对。在匹配算法设计中,考虑了影响程序运行的各种各样差错、数据"异构"的情况。(本文来源于《计算机与网络》期刊2010年14期)
左利云[8](2010)在《基于最优匹配模型的数据库压缩算法》一文中研究指出针对数据库中数据急速膨胀的状况,提出一种新的适用于语义压缩的数据库压缩算法——基于最优匹配的OPMC算法。算法将数据表中的属性元组分类并进行最优匹配的筛选为每类选取一个代表元组,将数据集中到最优匹配的聚类中心点上,消除相似的、冗余的数据,从而实现数据的压缩。该算法经仿真实验验证,有效改善了压缩比率,相对其他算法的压缩比率提高18%。(本文来源于《微型机与应用》期刊2010年14期)
金延红[9](2010)在《数据库清理中的一种匹配算法》一文中研究指出由于各种原因,数据库中的记录有很多重复的记录,有必要删除重复的记录。用Java编码提出一种新的匹配算法,解决了复杂的匹配问题,并且可根据需要扩展。(本文来源于《软件导刊》期刊2010年06期)
杜小坤[10](2010)在《数据库模式匹配算法研究》一文中研究指出模式匹配是模式间的一个二元操作,它以源模式和目标模式为输入,以两个模式中元素(在关系型数据库中对应于关系的属性)间的映射关系作为输出。随着数据库应用的越来越广泛,模式匹配在越来越多的应用领域中发挥着重要的作用,例如:模式集成、数据仓库、电子商务、语义WEB和P2P数据库等领域。以往的模式匹配操作大都由操作人员手工完成,这是一个费时、费力且易出错的过程,所以自动模式匹配算法的研究是目前一个研究热点。目前对模式匹配问题的研究成果比较丰富,已有的研究成果主要利用元素自身信息(如元素名、数据类型等信息)、数据实例信息(模式中的数据)和结构信息(模式元素相互关联的关系)来挖掘模式语义以获得正确的元素映射关系。但多数研究成果都主要利用元素自身信息计算元素之间的相似度,并根据相似度选取映射关系。已有的匹配算法主要存在如下一些不足,首先,利用的元素对应的数据实例信息和元素间的结构信息不足,信息不够全面,从而导致匹配结果的准确度不高;其次,已有的算法针对目标模式中的每个元素,在源模式的全局范围内搜索其候选匹配元素,搜索范围大,干扰选项多,匹配结果不够准确;另外,由于已有匹配算法都是基于启发式算法,所以对输出的任意一个匹配结果都无法完全确定其正确性。根据模式匹配研究成果的不足之处,在已有的研究基础上,我们针对模式匹配问题做了如下一些研究工作:将模式元素间的相似度分为语义相似度(根据元素自身信息得到的相似度)和结构相似度(根据元素之间的关联关系得到的相似度),并采用新的统计方法计算元素间的结构相似度,然后利用相似概率的概念将结构相似度和语义相似度综合;最后根据相似概率得到模式元素间的映射关系(模式元素之间的对应关系)。该方法是一种利用元素间的结构信息来辅助模式匹配的新方法。首先根据模式对应的数据实例信息来计算模式元素间的部分函数依赖度(模式结构信息),然后根据部分函数依赖关系建立模式元素间的依赖图,再根据元素依赖图计算元素间的结构相似度,最后得到模式元素间的映射关系。由于利用了更多的结构信息辅助匹配,所以该方法在性能上要优于其它仅使用完全函数依赖结构信息进行匹配的方法。这是一种将数据实例信息与结构信息相结合来辅助匹配的新方法。将模式中的元素按照描述对象的不同划分为不同的元素块,然后利用信息检索领域中的经典算法TF/IDF对源模式和目标模式中的元素块进行匹配,最后利用已有的模式匹配算法在相互匹配的模式块之间进行元素匹配。因为当模式中含有较少的元素时,已有的算法能够取得较好的匹配效果,所以利用本方法对大型模式进行分块匹配能取得较好的匹配效果。采用分层策略进行模式匹配研究中的一种全新的观点。从数据转换的角度分析自动匹配算法的匹配结果并提出了匹配结果中的依赖冲突的概念并给出依赖冲突的定义;然后给出了依赖冲突检测分类算法;最后将依赖冲突检测与几种已有的模式匹配方法相结合并对结合前后的匹配结果进行了对比,对比结果显示:在已有匹配方法中结合依赖冲突检测算法能显着提高匹配算法的准确度。(本文来源于《华中科技大学》期刊2010-05-17)
数据库匹配算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
模式匹配是数据集成的重要步骤之一,而数据库异构、数据量大等特点是匹配的难点所在。在梳理模式匹配概念和研究现状的基础上,提出一种基于Q-Gram数据库模式匹配算法,通过对实例数据进行切分,计算域之间的相似度,得到域的语义匹配度。该算法具有线性的时间复杂度,实验显示其能给出较为精确的匹配结果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据库匹配算法论文参考文献
[1].王荣华.基于概率的图数据库匹配优化算法研究[J].西安文理学院学报(自然科学版).2019
[2].杨航,侯琼煌.基于Q-Gram的数据库模式匹配算法[J].信息技术.2015
[3].纪亚洲,顾和和,李保杰.国土数据库变更中公共边自动匹配算法研究[J].中国矿业大学学报.2015
[4].马瑞敏,陈继红.基于二维空间元素匹配的数据库水印算法[J].计算机应用.2012
[5].黄博.图数据库中多子图匹配查询算法研究[D].复旦大学.2012
[6].丁国辉.数据库模式匹配算法的研究[D].东北大学.2011
[7].金延红,张国煊.关于数据库清理的一种模糊匹配算法[J].计算机与网络.2010
[8].左利云.基于最优匹配模型的数据库压缩算法[J].微型机与应用.2010
[9].金延红.数据库清理中的一种匹配算法[J].软件导刊.2010
[10].杜小坤.数据库模式匹配算法研究[D].华中科技大学.2010