导读:本文包含了扩展型关联规则论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:规则,信息检索,语言,矩阵,多维,数据挖掘,文本。
扩展型关联规则论文文献综述
黄名选,卢守东,徐辉[1](2019)在《基于加权关联模式挖掘与规则后件扩展的跨语言信息检索》一文中研究指出【目的】针对自然语言处理中查询主题漂移和词不匹配问题,提出一种基于加权关联模式挖掘和规则后件扩展的跨语言信息检索模型及其算法。【方法】该模型采用新的加权关联模式支持度和基于最大项目权值的项集剪枝策略挖掘频繁项集,利用置信度和相关度评价加权关联规则,根据扩展模型从规则中提取优质扩展词实现规则后件扩展,扩展词与原查询词项组合为新查询再次检索文档得到最终检索结果。【结果】实验结果表明,与单语言检索基准比较,本文检索模型的R-prec和P@10平均增幅分别为42.49%和25.53%;与跨语言检索基准比较,其平均增幅分别为91.87%和64.61%;与现有基于加权关联规则挖掘的跨语言检索方法比较,R-prec和P@10最高平均增幅分别可达93.20%和34.60%。【局限】只进行实验性研究,需要探讨在实际跨语言搜索引擎中的具体应用。【结论】本文检索模型能有效地减少查询主题漂移和词不匹配问题,改善和提高检索性能。(本文来源于《数据分析与知识发现》期刊2019年09期)
陈可嘉,赵政[2](2019)在《用户交易数据不足情况下的商品关联规则扩展与应用》一文中研究指出在电子商务环境下,如何有效地对商品进行推荐具有重要意义。然而传统的关联规则推荐算法往往需要大量的用户交易数据作为支撑,对交易数据不足的商品,比如刚上架不久的新品却无法生成关联规则。从相似性的角度出发,引入商品文本信息,以关联规则推荐算法中经典的Apriori算法为基础,通过构建商品间相似度矩阵,提出一个基于商品相似度的关联规则扩展方法,从而实现对用户交易数据不足的商品生成可靠的关联规则推荐。最后以淘宝平台上的真实数据为例,验证该方法的有效性和实用性。(本文来源于《福州大学学报(哲学社会科学版)》期刊2019年01期)
黄武锋,何冬蕾,黄名选[3](2019)在《基于关联规则后件扩展的越英跨语言信息检索》一文中研究指出针对跨语言信息检索中存在的查询主题漂移问题,提出一种基于完全加权关联规则后件扩展的越英跨语言信息检索模型,给出了模型结构及其各个功能模块,详细阐述了模型的关键技术及其算法。该模型将完全加权模式挖掘技术和用户相关反馈扩展融合应用于越英跨语言信息检索,将越南语查询通过机器翻译系统译为英文并检索为英文文档,提取前列初检文档构建用户相关反馈文档集,采用完全加权关联规则挖掘技术对用户相关反馈文档集挖掘与原查询相关的关联规则,将关联规则后件作为扩展词,并和原查询组合成新查询再次检索英文文档,得到最终检索结果。在NTCIR-5 CLIR数据集上的实验结果表明,该模型能减少越英跨语言检索中的查询漂移,提高和改善其检索性能。(本文来源于《计算机技术与发展》期刊2019年04期)
黄名选,蒋曹清,何冬蕾[4](2018)在《基于矩阵加权关联规则的跨语言查询译后扩展》一文中研究指出首先提出矩阵加权项集支持度计算方法,给出面向跨语言查询扩展的矩阵加权关联模式挖掘算法.然后提出基于矩阵加权关联规则挖掘的跨语言查询译后扩展算法.借助机器翻译进行首次跨语言检索,得到前列初检文档,并经用户相关性判断后得到相关反馈文档.通过计算支持度从相关反馈文档中挖掘含有原查询词的矩阵加权频繁项集,通过置信度-兴趣度评价框架从频繁项集中提取含有原查询词的关联规则,将规则的后件或前件作为扩展词,利用规则的置信度和兴趣度衡量扩展词的重要性,完成跨语言查询译后扩展.在NTCIR-5 CLIR标准测试集上的实验表明,文中算法可以有效提升跨语言查询扩展性能,有利于长查询的跨语言检索,译后后件扩展性能优于前件.(本文来源于《模式识别与人工智能》期刊2018年10期)
胡思琪[5](2016)在《基于改进关联规则的学术文献语义查询扩展研究》一文中研究指出在进行信息检索时,如何能够快速、精确地查找到符合用户查询目的的信息并反馈给用户,是目前的研究热点之一。当前所使用的检索系统大部分基于关键字匹配和布尔技术进行信息匹配。随着信息量的增长,在进行检索时,很容易导致大量相关信息无法反馈和信息过载等问题。针对上述问题,众多专家学者将重点聚焦在查询扩展这一解决问题的有效方案上,使其得到了迅猛发展。行内专家主要提出了基于全局聚类分析、全局潜语义索引、局部聚类分析、统计词典、语义词典、局部反馈、用户日志等扩展模型,这些模型均一定程度上解决了检索过程中出现的问题,但由于这些方法本身存在的缺点以及对语义的理解程度不高,并非是这一问题的最佳解决方式,仍存在诸多不足之处。本文通过研究总结关联规则挖掘技术和查询扩展技术的相关理论,在分析各种经典算法缺点的基础上,将关联规则和术语词表两种技术结合起来,提出了基于改进关联规则挖掘和术语词表二次筛选的查询扩展算法,并实验验证了该方式的可行性及有效性。本文研究重点在于关联规则挖掘算法的改进,和将其与术语词表结合起来应用到查询扩展中。论文具体研究内容如下:对关联规则相关理论和经典挖掘算法进行了较为深入的分析和研究,总结其特点及其不足,并指出目前应用较广的优化方式。对查询扩展各种方法的进展和优缺点进行了系统的阐述。综合目前各种挖掘算法优劣、本文研究对象(学术文献)的特性、算法实现可行性及有效性等综合因素,提出基于散列技术来对FP-GROWTH算法进行改进,并使用测试集对基于散列技术改进FP算法的挖掘效率和原始FP算法进行对比分析。最终的实验验证了基于散列技术改进FP算法的可行性,及其挖掘关联规则时在效率上的提高。与未改进的FP-GROWTH算法相比,挖掘时间缩短了 50%以 上。将关联规则和术语词表,两种可独立应用到查询扩展中的技术相结合。提出基于改进关联规则和术语词表的查询扩展算法。扩展过程中使用基于散列技术改进的FP-GROWTH算法,挖掘初始查询反馈给用户的前N篇(最终实验确定N=30),并将满足Min_sup的关联规则提取出来,构成与原查询相关的候选扩展词集。通过人机交互,将候选扩展词集反馈给用户,使用户根据提供的术语词表对候选扩展词集进行二次筛选,对扩展词集中的词汇按照重要程度排降序,选择前M列(本次实验中M=2)添加到原查询检索词中,构成最终查询词。设计实验实现查询扩展算法。使用Lucene开源全文检索代码包来构建本地检索系统,和以Lucene为应用主体的IKAnalyzer轻量级开源中文分词工具包进行分词。为了解决IKAnalyzer分词粒度太细,术语被切割的问题,基于本文中抽取的术语词构造扩展词表,进行中文分词,解决类似“关联规则”被切分为“关联”“规则”两部分的情况。利用所设计的查询扩展流程和框架进行相关实验,评估关联规则和术语词表相结合的扩展方法的性能。实验结果表明使用关联规则和术语词表相结合的查询扩展方法提升了对用户检索意图的理解能力,检索性能得到了较大幅度的提升。查准率提升了 19.2%,反馈结果前20篇文档中,用户感兴趣文档检出率上升了 46.1%。实验结果表明使用基于关联规则和术语词表的查询扩展算法能获得很好的效果。(本文来源于《福州大学》期刊2016-03-01)
曾雷[6](2015)在《基于项权值变化的矩阵加权关联规则挖掘和扩展查询技术信息检索模型研究》一文中研究指出将项权值变化的矩阵加权关联规则挖掘技术应用于信息检索,提出一种基于项权值变化的矩阵加权关联规则挖掘的信息检索模型及其算法,采用新的剪枝策略和模式支持度计算方法。实验结果表明,新模型检索性能得到改善和提高。(本文来源于《软件导刊》期刊2015年07期)
柯佳,詹永照,陈潇君,汪满容[7](2013)在《基于扩展格框架标注的视频事件多维关联规则挖掘方法》一文中研究指出针对视频复杂运动事件进行了分析,对用于自然语言处理的格语法理论进行了扩展,增加时间格结构,并采用扩展后的格框架对复杂事件进行了标注,并将数据存储在数据立方体中,最后采用MDFP-growth方法对多维概念格进行关联规则的挖掘。在实验部分,对比了扩展后的格框架与扩展前原方法对复杂事件标注的结果,并比较扩展了时间格后的四维数据〈PRED,Ag,T,Loc〉和扩展前叁维数据〈PRED,Ag,Loc〉挖掘其关联规则中系统运行时间,产生规则数对比结果及视频检测的准确率和召回率对比。实验证明,提出的方法能更加准确地标注出复杂事件,并具有更高的处理效率。(本文来源于《计算机应用研究》期刊2013年10期)
刘彩虹,祁瑞华,刘强[8](2013)在《一种正负关联规则的快速查询扩展算法》一文中研究指出将负关联规则引入到查询扩展研究中,提出了新的查询扩展模型,并设计了一种基于正负关联规则的快速查询扩展算法。该算法通过对文本事务数据库的布尔化表示及数据结构的合理分配,采用向量内积策略来产生频繁和非频繁特征词集,并从中挖掘出词间正负关联规则。实验结果表明,该算法能对原查询词进行快速有效的扩展,且仅需扫描1次文本数据库,并具有动态剪枝、不保留中间候选项和节省大量内存等优点,对信息检索中查询扩展的研究具有参考价值。(本文来源于《中国科技论文》期刊2013年01期)
李涛[9](2012)在《基于关联规则的查询扩展技术研究》一文中研究指出随着网络信息量的日益剧增,通过搜索引擎找到人们想要的确切信息还存在一定的困难,查询率不高和查准率低,成为搜索引擎迫切需要解决的问题。针对这一问题,本文依据Van Rijsbergen学者提出的利用对原查询进行修改来提高检索能力的观点,对基于关联规则的查询扩展技术进行研究。主要内容如下:1.首先对本文研究的基础内容:数据挖掘、关联规则、查询扩展,进行详细介绍,针对现有的基于关联规则的查询扩展技术进行分析,指出优缺点,针对共性的缺点:现有的基于关联规则的查询扩展算法都不注意关联规则挖掘算法的挖掘效率以及采用的挖掘算法是否适合,作为本文的研究重点。2.针对上述问题,本文首次提出基于最大频繁项目集挖掘的查询扩展算法,算法采用基于向量空间模型的查询技术,对初次检索到的n篇文档进行分词处理,将处理后的分词以垂直数据格式进行表示,采用求交集的方法得到项目集支持度,同时采用集合枚举树数据结构、一定的剪枝策略进行最大频繁项目集挖掘,得到扩展词库;扩展词和初始查询词相结合,进行二次检索。实验证明,同以往算法相比,算法效率得到提高。3.本文提出的基于最大频繁项目集挖掘的查询扩展算法,是假设原查询词和扩展词的重要程度一样的基础上进行的,没有考虑原查询词和扩展词的权重问题;同时最大频繁项目集挖掘,丢失了部分频繁项的支持度信息。针对上述问题,本文提出基于频繁闭合项目集的查询扩展算法。算法采用HT-struct链接结构,采用深度优先搜索策略,结合一定的剪枝技术,挖掘出频繁闭合项目集,得到关联规则,得到扩展词库;算法同时根据规则置信度衡量扩展词的权重。实验证明,算法的效率得到了提高,算法具有可行性。(本文来源于《解放军信息工程大学》期刊2012-10-25)
张云洋,刘芳[10](2012)在《基于维间扩展和事务压缩的关联规则算法改进》一文中研究指出Apriori是关联规则挖掘的经典算法,在利用该算法进行医疗数据挖掘的过程中,发现其频繁项集产生过程有一些不必要的开销,为此提出了改进算法Mypriori,利用维间扩展和事务压缩策略来提高频集发现的效率,并通过实验验证了算法的有效性。(本文来源于《计算机时代》期刊2012年09期)
扩展型关联规则论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在电子商务环境下,如何有效地对商品进行推荐具有重要意义。然而传统的关联规则推荐算法往往需要大量的用户交易数据作为支撑,对交易数据不足的商品,比如刚上架不久的新品却无法生成关联规则。从相似性的角度出发,引入商品文本信息,以关联规则推荐算法中经典的Apriori算法为基础,通过构建商品间相似度矩阵,提出一个基于商品相似度的关联规则扩展方法,从而实现对用户交易数据不足的商品生成可靠的关联规则推荐。最后以淘宝平台上的真实数据为例,验证该方法的有效性和实用性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
扩展型关联规则论文参考文献
[1].黄名选,卢守东,徐辉.基于加权关联模式挖掘与规则后件扩展的跨语言信息检索[J].数据分析与知识发现.2019
[2].陈可嘉,赵政.用户交易数据不足情况下的商品关联规则扩展与应用[J].福州大学学报(哲学社会科学版).2019
[3].黄武锋,何冬蕾,黄名选.基于关联规则后件扩展的越英跨语言信息检索[J].计算机技术与发展.2019
[4].黄名选,蒋曹清,何冬蕾.基于矩阵加权关联规则的跨语言查询译后扩展[J].模式识别与人工智能.2018
[5].胡思琪.基于改进关联规则的学术文献语义查询扩展研究[D].福州大学.2016
[6].曾雷.基于项权值变化的矩阵加权关联规则挖掘和扩展查询技术信息检索模型研究[J].软件导刊.2015
[7].柯佳,詹永照,陈潇君,汪满容.基于扩展格框架标注的视频事件多维关联规则挖掘方法[J].计算机应用研究.2013
[8].刘彩虹,祁瑞华,刘强.一种正负关联规则的快速查询扩展算法[J].中国科技论文.2013
[9].李涛.基于关联规则的查询扩展技术研究[D].解放军信息工程大学.2012
[10].张云洋,刘芳.基于维间扩展和事务压缩的关联规则算法改进[J].计算机时代.2012