关联规则算法及其在个性化网站的应用研究

关联规则算法及其在个性化网站的应用研究

朱峰[1]2004年在《关联规则算法及其在个性化网站的应用研究》文中研究指明数据挖掘就是从大量数据中提取和挖掘知识,故又称为数据库知识发现。关联分析发现关联规则是数据挖掘中最活跃的领域。在很多情况下,用户关心的只是关联规则的一个子集,因此科研人员引入了约束关联规则的概念。本文对关联规则和约束关联规则挖掘算法进行了研究和分析,发现基于候选集的约束算法仍有很大的缺陷,主要问题是: 1.需要反复扫描数据库 2.产生大量的候选集 因此基于候选集的约束算法在挖掘低支持度、长模式的规则时效率低下。本文分析了这些算法,提出了基于H-Mine算法的Con-H-Mine项目约束算法(Constraint-based Hyper-Structure Mining),该算法仅需扫描两遍数据库,并且采用模式增长的方法不产生候选集;采用Con-H-Struct(Constraint-based Hyper-Structure)结构存储数据集合,减少了空间的开销。同时该算法也可以适用于大型数据集,在进行数据集划分时能够有效地进行空间度量。 通过以上改进,设计出一个较好的、有效的数据挖掘算法,效率有所提高,优化了关联规则的挖掘。并以此算法为基础设计出一个个性化网站的原型系统并验证了可行性。

王利[2]2006年在《Web使用挖掘方法及其在个性化学习系统中的应用研究》文中研究表明数据挖掘就是从海量数据的集合中发现有效的、新颖的、有用的、可理解的模式。Web使用挖掘是数据挖掘技术在Web使用数据上的应用,它的主要任务是研究用户的浏览行为,发现用户对网页的兴趣度和访问模式,从而可以改进网站结构,为用户提供个性化服务。本文的研究内容包括:(1)对Web使用挖掘的特点、方法及相关技术分析,指出了现有Web使用挖掘的数据采集技术的不足;(2)提出一种综合获取用户浏览信息的方法;(3)讨论基于图结构的Web访问序列模式挖掘方法;(4)提出基于内容过滤和协同过滤相结合的个性化推荐算法;(5)将Web使用挖掘技术应用于远程学习系统,通过Web使用模式挖掘对学习者访问学习网站和使用学习资源的信息进行挖掘分析,及时了解学习者的学习需求、学习进度、兴趣爱好,适时推出个性化的学习模式,构建个性化的网络学习系统。本文的主要特色:把基于内容过滤的推荐算法和协同过滤的推荐算法相结合;在传统的学习网站中加入了个性化推荐模块,从而更加适应现代的个性化教育理念。

朱峰, 陈慧萍[3]2004年在《关联规则挖掘算法及其在个性化网站中的应用研究》文中研究表明较为详细地介绍了关联规则挖掘的基本内容和相关算法,给出了在web个性化网站的建设中,利用关联规则挖掘对用户数据进行分析和预测用户行为的一个实例.

王江北[4]2010年在《基于模糊理论的关联规则挖掘及其在个性化推荐中的应用研究》文中研究指明随着电子商务的迅速发展,个性化推荐得到了越来越多人的重视。个性化推荐是一种已经被公认的能够有效解决internet“信息过载”的方法。关联规则挖掘技术是个性化推荐技术中一个重要的研究方向。目前对关联规则的研究有很多,对其进行研究不仅有很重要的理论意义,而且也有着重要的应用价值。关联规则算法研究是关联规则数据挖掘研究中的重要部分,其中最着名的算法是Agrawal提出的Apriori算法。现有很多算法是对Apriori算法的改进。多数算法是基于所有项目具有相同重要性程度的前提提出的。但现实中并不是如此,不同的项目往往具有不同的重要性程度。本文引入了加权关联规则的概念,比较分析了现有的加权关联规则的优缺点,从实际应用出发通过属性所能带来的实际效益来确定该项目的权值。而且充分考虑了时间对数据库中数据重要性的影响,对加权关联规则算法进行了改进,并通过实例对算法进行了详细说明。传统的算法都是集中在确定的概念上来进行,不适用于更加贴近现实的模糊概念。本文结合模糊集理论进一步研究,拓宽了关联规则的应用范围。本文主要对模糊关联规则算法中隶属度函数的确定问题进行了进一步的讨论,并结合加权关联规则算法设计实现了改进的加权模糊关联规则算法NFWAR(New Fuzzy Weight Association Rules)。通过现实数据对算法的性能进行了进一步的实例分析和仿真测试,结果证明了算法能够挖掘出有意义的关联规则,有较好的实验结果。

蔡宏果[5]2010年在《基于基因表达式编程的Web个性化推荐技术研究》文中认为如果说过去的Internet是搜索技术大行其道的时代,那么未来的Internet将属于个性化推荐技术。Web个性化推荐技术研究的重点是在各个工作站上采用不同的推荐算法对站内Web进行智能推荐。一个完整的推荐系统由叁部分构成:行为记录模块、模型分析模块和推荐模块。行为记录模块负责记录能够体现用户喜好的行为,Web个性化推荐系统记录用户行为主要靠网站服务器的WebLog(日志记录)。随着网络技术的日新月异,云计算时代已经来临,相比较Web网络编程技术和Web数据挖掘而言,网站服务器记录用户行为的日志记录技术显得落后,还处于静态网站记录时期。本文首先系统的研究并提出了一种新的基于Server Session的服务器日志记录格式。这种日志格式既能适应传统Web技术又能适用Web Services技术下的网站对用户访问行为的记录需要。新的日志格式能更准确、恰当、高效的记录用户访问网站的情况。并且,实验证明这种日志更适合Web使用挖掘的需要,能有效和更高效的挖掘到用户访问网站的模式,为网站建设和发展服务。模型分析模块则实现了对用户行为记录的分析,采用不同的推荐技术(算法)建立起模型描述用户的喜好信息。个性化推荐技术主要有叁种:基于规则过滤技术、基于内容过滤技术、基于协作过滤技术。规则过滤技术当前主要是通过关联规则挖掘来发现信息,通过用户的静态特征和动态属性来推荐信息。本文接着为了挖掘Web服务器日志中的热点Web页面访问集及其关联规则,为初级用户提供推荐服务,提出了一种基于泛化的GEP挖掘多层关联规则(mining Multiple-layers Association rule using Generalizing-based GEP, MAGGEP)的算法。协作过滤技术是迄今为止最成功的个性化推荐技术。当前主要是针对协作过滤存在的问题,进行不同的方法研究。为了进一步解决协同过滤技术的扩展性能问题,目前比较有效的办法是在用户评分数据上做一次聚类分析,本文最后依据基于密度的聚类思想,将基因表达式编程推进到个性化推荐技术中,提出了一种基于密度的GEP聚类(Density-based methods GEP-Cluste,DGEPC)算法来解决最近邻居问题,对用户进行聚类,为个性化推荐系统服务。

杨麟儿[6]2008年在《基于用户兴趣的个性化推荐系统的研究与设计》文中提出随着互联网的普及和电子商务的迅猛发展,信息膨胀与冗余给人们的社会活动和商务活动带来了信息选择的困惑。如何为每个用户提供快捷准确,满足个人实际需要的信息,已成为众多业内人士越来越关注的问题。推荐系统在理论和实践中都得到了很大发展,但是随着电子商务系统规模的进一步扩大,推荐系统中存在的稀疏问题和冷启动问题严重影响了推荐质量。针对推荐系统面临的主要挑战,本文对推荐系统及其主要的推荐技术—协同过滤技术进行了有益的探索和研究。本文的主要研究内容如下:1)基于奇异值分解的改进协同过滤算法。本文通过奇异值分解的方法对用户评分矩阵进行降维,搜索最佳的用户特征矩阵和项特征矩阵,使其能有效地反映原始评分数据的特征,并在此基础上利用特征矩阵进行用户评分预测。实验结果表明,基于奇异值分解的改进协同过滤算法可以挖掘用户评分数据的潜在特征,并且能有效地解决用户评分数据的稀疏问题,从而提高推荐系统的推荐质量。2)基于项的改进协同过滤算法。针对用户评分数据的极端稀疏,本文在传统的基于项的协同过滤算法的基础上,在度量项之间相似性阶段,采用基于均方误差的相似性度量标准进行计算,并且在评分预测阶段,采用基于回归方法得到用户对未评分项的评分值。实验结果表明,基于项的改进协同过滤算法可以以较小的时间代价来有效提高评分预测的准确性,同时,很好地弥补了传统的协同过滤算法在冷启动问题上的不足,提高了推荐系统的推荐质量和推荐精度。

吴增红[7]2011年在《个性化地图服务理论与方法研究》文中认为新空间信息技术的发展正促使地图服务发生着诸多变化,如服务对象的大众化、空间数据更新的实时化、交互设备的多样化、服务理念的个性化。因此,个性化地图服务(Personalized Map Service,PMS)成为地图学研究中具有挑战性的新课题。本文提出定制与自适应相结合的个性化地图服务概念,并对其理论与方法进行系统的研究与实践,主要研究内容和创新点如下:1.个性化地图服务的研究背景及其相关理论与技术研究现状分析。总结了个性化地图服务及其相关领域中的个性化服务理论、技术与方法,详细分析了国内外个性化地图服务系统的实现、理论与技术框架、知识工程、情境建模、评价等重要方面的研究现状,指出了其中存在的主要问题。2.个性化地图服务理论与技术框架研究,包括概念、理论框架和技术框架。概念研究中明确了个性化地图服务的基本概念、特征及其研究内容,提出了个性化地图服务研究中的关键问题,指出了网络与移动环境中个性化地图服务面临的特殊问题;理论框架研究中含盖了其理论基础与方法,详细介绍了重要理论及其在个性化地图服务中的应用;技术框架研究中分析了个性化地图服务系统的数据流,并根据基本构架部分的划分,分析了各环节中的重要支持技术。3.个性化地图服务知识工程理论与方法研究。系统地研究了个性化地图服务知识工程的理论与方法,为基于知识的个性化地图服务提供基本的理论方法。提出并研究了个性化地图服务系统知识工程的以下内容:知识的内容与特征、知识的获取方式与方法、知识表达方法、知识推理与解释机制、知识库的的构架与维护。4.个性化地图服务模板设计方案与规则获取的实验与算法研究。主要以地图可视化适应设备规则获取、地图可视化适应用户视觉感受与认知规则获取、基于用户浏览行为的兴趣获取、基于用户定制行为的规则获取四个典型实验为例,详细介绍各个实验的实验平台、实验方案与实现、及相应的算法与分析,使用的算法包括统计方法、决策树ID3算法、基于用户浏览行为的兴趣度估计算法、融合用户兴趣度的Apriori关联规则挖掘算法,同时列举了以上四类模板设计方案知识与规则知识获取的相关实验内容。5.个性化地图服务多维情境建模研究。讨论了个性化地图服务情境分类模型的内容及其表示。提出了情境综合模型的函数表达式及其特征,重点对多维情境建模的聚类策略与相关算法进行改进。聚类策略中引入子空间概念,根据ID3算法进行基于熵权的属性集权重向量计算,然后针对各个子空间计算加权距离进行相似度度量,最后根据OPTICS密度聚类算法进行子空间聚类,赋予各多维情境相应的决策规则即可建立情境综合模型。针对情境模型匹配中多个相似度接近的模型难以取舍及情境时序性对匹配的影响,提出了融合概率与时序的情境模型匹配方法模型。研究了多维情境模型的动态更新的原理,描述了基于用户行为的功能模型与用户兴趣模型的动态更新算法。6.个性化地图服务系统评价研究。提出了融合分层评价与启发式评价的个性化地图服务系统综合评价框架及内容;探讨了适用于个性化地图服务系统评价的适应性系统评价方法及地图学认知实验方法,并区分了各种评价方法在不同评价阶段的适用性;讨论了个性化地图服务系统的评价标准;在评价标准的基础上建立了一套评价指标体系,并明确了评价指标之间的层次关系;最后分析了个性化地图服务系统的评价与设计之间的关系。7.个性化地图服务试验系统的设计与实现。基于以上个性化地图服务理论与技术的研究,运用ASP.NET Ajax技术设计实现了个性化旅游网络地图服务系统作为试验系统。构建了试验系统的技术框架与功能框架;针对旅游网络地理信息服务这一主题,构建了系统的用户界面模板、地图符号模板、色彩设计模板、导航功能模板及数据推荐模板;设计实现了部分自适应、个性化实时定制、个性化在线定制离线制图服务;并进行了初步评价。

陈利华[8]2005年在《网站个性化信息服务研究》文中研究说明随着万维网(WWW)成为信息传播、交流与共享的主要媒体,全球Web站点数目迅速增长,而在数量增多的同时,网站的规模也日益扩大,各个Web站点的信息量及其复杂度也迅速上升,从而直接导致用户寻找信息的困难。因此,研究如何使网站方便用户访问,如何在短时间内提供用户需要的资料,成了当前网站建设需要重点考虑的问题。针对不同用户提供不同的服务策略和服务内容的服务模式,即个性化的信息服务,是网站解决这个问题最有效的办法,实现网站的个性化服务也逐渐成为研究的热点。基于此,本文讨论和分析了网站个性化信息服务的理论、背景和实现技术,在此基础上探讨了个性化网站的实现目标和功能,并构建了一个较全面的个性化网站的体系结构。 论文主要分为四个部分。第一部分首先介绍了个性化信息服务的内涵和特点,然后分析了网站实现个性化信息服务的具体条件与服务模式,最后提出网站实行个性化信息服务是用户的需求与网站自身发展的需要。第二部分首先介绍了个性化信息服务的研究进展,然后调查研究了目前网站个性化信息服务的实例,包括门户网站、电子商务网站、公司企业网站、图书情报机构网站和专业服务资讯网站的个性化服务的实例。第叁部分介绍了实现个性化信息服务的相关技术,包

富丽娜[9]2007年在《关联规则算法研究及其在汽车销售网站的应用》文中研究说明随着Internet的飞速发展,网络已经成为人们获取信息的一个重要途径,用户对Web站点的要求也越来越高。这种要求体现在网站的设计是否随用户的兴趣而有针对性地改变,这就引出了“个性化”这个研究课题。在网站的设计实现过程中,如果能够根据用户的访问兴趣进行个性化推荐,就可以更加有针对性的满足用户的需求,赢得用户的青睐。根据数据挖掘思想和Web数据挖掘技术,通过发现隐藏在数据中的用户行为模式,可以有效的实现网页的个性化推荐。本文在分析数据挖掘中关联规则理论的基础上,对关联规则挖掘算法进行了研究,FP-growth算法对不同长度的规则都有很好的适应性,同时在效率上较Apriori算法有很大的提高。但FP-growth算法是通过逐步生成条件模式基和条件频繁模式树来挖掘频繁项集,因而影响了频繁项集的挖掘效率。结合个性化推荐中关联规则的性质和特点,给出一种适合页面推荐的IFST算法,该算法在FP-growth算法初始FP-Tree结构的基础上,采用IFreq-Set-Tree结构存储频繁项集,生成前项为i-size(1

罗胜阳[10]2008年在《协同过滤技术及其在电子商务推荐领域的应用研究》文中研究表明随着互联网的普及和电子商务应用的广泛深入,人们在享受网上购物便捷性的同时也陷入了信息过载的困境,用户在大量的产品信息中难以找到自己需要的商品。因此,电子商务推荐系统应运而生。本文对电子商务推荐系统进行了较深入的研究,详细分析了各种个性化推荐技术在电子商务推荐领域的应用现状和前景。在此基础之上,重点研究了电子商务推荐领域的主流技术--协同过滤技术。在详细分析传统的基于项目的(Item-Based)协同过滤算法存在的问题的基础上,提出了一个新的基于项目关联性评分预测的协同过滤算法IAPCF。区别于传统的算法,IAPCF算法不是根据项目之间的相似度,而是根据项目之间的关联规则来寻找项目的最近邻居集合。实验结果表明,IAPCF算法比传统的基于项目的协同过滤算法具有更好的推荐精度。随着电子商务网站规模的增长,基于用户的(User-Based)协同过滤算法存在较严重的数据稀疏性问题,使得用户之间相似度的计算结果不准确,导致推荐质量急剧下降。本文结合上述提出的新算法IAPCF对此进行了改进。改进后的算法IAPCF-UB与传统算法的不同之处在于:在形成用户邻居阶段,计算用户间相似度时,先利用IAPCF算法,根据两两用户间评分项目的并集,预测用户对并集中未评分项目的评分,增加用户之间共同评分的项目数,从而可以解决用户-项目评分矩阵的极端稀疏性,使得计算得到的目标用户的最近邻居更加准确,从而提高算法的推荐精度。实验结果表明,在面对稀疏数据集时,改进算法IAPCF-UB相比于传统的基于用户的协同过滤算法能显着提高推荐质量。

参考文献:

[1]. 关联规则算法及其在个性化网站的应用研究[D]. 朱峰. 河海大学. 2004

[2]. Web使用挖掘方法及其在个性化学习系统中的应用研究[D]. 王利. 苏州大学. 2006

[3]. 关联规则挖掘算法及其在个性化网站中的应用研究[J]. 朱峰, 陈慧萍. 河海大学常州分校学报. 2004

[4]. 基于模糊理论的关联规则挖掘及其在个性化推荐中的应用研究[D]. 王江北. 河北工业大学. 2010

[5]. 基于基因表达式编程的Web个性化推荐技术研究[D]. 蔡宏果. 广西师范学院. 2010

[6]. 基于用户兴趣的个性化推荐系统的研究与设计[D]. 杨麟儿. 北京交通大学. 2008

[7]. 个性化地图服务理论与方法研究[D]. 吴增红. 解放军信息工程大学. 2011

[8]. 网站个性化信息服务研究[D]. 陈利华. 四川大学. 2005

[9]. 关联规则算法研究及其在汽车销售网站的应用[D]. 富丽娜. 大连理工大学. 2007

[10]. 协同过滤技术及其在电子商务推荐领域的应用研究[D]. 罗胜阳. 南京理工大学. 2008

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

关联规则算法及其在个性化网站的应用研究
下载Doc文档

猜你喜欢