页面聚类论文_富豪,邓立国

导读:本文包含了页面聚类论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:页面,算法,模型,向量,本体,自适应,频繁。

页面聚类论文文献综述

富豪,邓立国[1](2019)在《基于ALCIF描述逻辑的Web页面聚类》一文中研究指出在Web页面聚类过程中为了能有效处理标签内容以及标签内容之间的联系,选用ALCIF描述逻辑表示方法来对Web页面信息进行抽取与存储,并对抽取到的知识内容进行约减,从而实现对Web文档的降维,以此节约聚类时间。最后用实验证明这种知识表示方法对于Web页面聚类的有效性。(本文来源于《现代计算机》期刊2019年12期)

尤枫,张雅峰,赵瑞莲,马金慧[2](2018)在《基于页面聚类的Web应用测试方法研究》一文中研究指出现有的Web测试是由前端出发,通过分析页面DOM结构来获取状态与状态跳转的条件。但现有技术是将任何DOM节点的改变都认定为产生了新的DOM树,如果对于任何改变DOM结构的操作都认为是新操作来重新生成测试用例会浪费相当的时间和人力。提出一种基于页面DOM相似度的Web应用单元测试方法。利用爬虫程序获取页面状态与相应的DOM结构;利用DOM相似度对DOM进行评价,并对DOM状态进行分类,利用分类簇的中心作为相应功能的操作结果,返回应用中寻找相应的代码块并且进行测试。实验结果表明:该方法可以有效地降低"单一DOM对应单一状态"模式中的冗余状态跳转,可以达到合理的功能发现率,同时有效降低冗余的待测试状态。(本文来源于《计算机工程与应用》期刊2018年05期)

姚瑶,王战红,石磊[3](2015)在《一种基于页面聚类的Web概念化建模新方法》一文中研究指出Web结构优化技术在降低访问延迟、提高访问效率上具有重要作用.由此提出根据用户访问路径建立Web层次模型(WHM),利用页面相似度合并同层相似页面,从而构建Web概念化模型(WCM).实验及分析表明,WCM模型能够在适度聚类的情况下清晰地展现Web结构.此外,将WCM模型应用于预取系统,该模型所采用的聚类算法在预取效率方面明显优于传统方法,具有可行性和高效性.(本文来源于《微电子学与计算机》期刊2015年01期)

凌梓[4](2014)在《基于本体Web页面聚类的多用户需求发现》一文中研究指出一、引言随着云计算研究与应用的逐步展开和迅速普及,服务的数量增长速度也不断加快。在这样一个海量的集合上,通过服务发现和组合来满足用户的服务需求,其难度在不断增加。一方面由于服务具有分布、自治的特征,且数量急剧增长,在海量的服务资源中选择可互操作的服务候选者存在巨大困难;另一方面云计算环境中用户需求多变,业务流程日益复杂,服务资源无法即时适应其变化。计算要求面向用户需求,以服务为基本单位,通过服务的协同和交互快速构建软件系统,已经成为构建大规模分布式系统的主流计算方式,这就迫(本文来源于《教师》期刊2014年31期)

姚瑶,王战红,石磊[5](2014)在《基于页面聚类的Web概念化模型研究》一文中研究指出针对Web对象激增导致网站层次结构复杂难辨的问题,提出一种基于页面聚类的Web概念化建模方法。首先基于用户访问路径建立Web层次结构模型(WHM),然后依据页面相似度对位于同一层次的页面进行聚类,得到Web概念化模型(WCM),最后将该模型应用于Web预取系统。实验结果表明,WCM模型在保持较高预取效率的前提下具有较好的聚类效果和适用性。(本文来源于《科学技术与工程》期刊2014年25期)

方杰,张结魁,周军[6](2009)在《基于有向带权图的页面聚类算法研究》一文中研究指出聚类算法是数据挖掘中的一个重要的分析工具。Web使用挖掘中的聚类分析一般分为用户聚类和页面聚类。其中页面聚类是指导网站结构离线优化的重要方法。利用有向带权图表示用户的访问会话记录,对建立的有向带权图模型运用聚类算法实现页面聚类。选取真实数据对典型的聚类算法K-means算法、DBSCAN算法和COBWEB算法进行实验。实验结果表明,在选取的数据集范围内,COBWEB算法准确率要高于K-means算法和DBSCAN算法,时间性能与用户访问频率矩阵大小有密切关系。(本文来源于《计算机技术与发展》期刊2009年09期)

方杰[7](2009)在《聚类算法及其在页面聚类中的应用研究》一文中研究指出互联网已经成为一个巨大的、分布式、全球信息服务中心。如何为用户快速、高效、准确地提供他们所需要的,并具有高度相关性的一簇Web页面,已经成为业界研究的重要内容。解决这个问题的一个有效途径就是对页面进行合理的聚类分析,从而更高效地进行Web信息的分类、存储、检索和集成。本文研究的主要目的是聚类算法的改进及其在页面聚类方面的应用。本文的主要内容如下:(1)对聚类分析的理论、方法与过程进行研究。(2)选取了聚类算法中广泛研究的基于划分的K-means算法和基于密度的DBSCAN算法进行改进研究。并通过常用知名数据集进行算法实验。本文对K-means算法的改进目的是改变初始聚类中心的选取,即如何找到与数据在空间分布上相一致的初始聚类中心,提出的改进方法是根据数据的自然分布来选取初始聚类中心。在DBSCAN算法的改进中,对参数ε和Minpts给出了一种自动选取方法,减小了主观性的影响。(3)给出页面聚类的步骤和算法描述。(4)选定数据集对页面聚类算法进行实例验证。系统实现了两种算法的页面聚类过程。并对实例验证结果进行分析评价。实验结果表明:在选取的数据集范围内,改进后的两种算法在准确率上均有所提高;改进后两种算法在页面聚类准确率相差不大且随着实验数据集的增大而减小;K-means改进算法在时间性能方面明显优于DBSCAN改进算法。(本文来源于《合肥工业大学》期刊2009-03-01)

林文龙,刘业政,余智学[8](2008)在《用页组拓扑平均距离改善页面聚类算法》一文中研究指出提出一种支持站点结构优化的页面聚类改进算法,通过引入图论中的拓扑平均距离,量化评估与挖掘站点结构中访问效率较低的内容文档集合为结构优化的兴趣页组,挖掘的页组具有更高的兴趣性,并将兴趣页组挖掘算法融入到拓扑优化算法中。实验结果表明改进算法能更好地优化站点结构,较一般算法收敛性好。(本文来源于《计算机科学》期刊2008年10期)

谢红薇,颜小林,余雪丽[9](2008)在《基于本体的Web页面聚类研究》一文中研究指出提出了一个基于本体的Web页面聚类系统原型,通过构建一个简单的搜索引擎并对结果进行聚类,大大节省用户发现所需信息的时间。同时将领域本体引入聚类系统中,提高了聚类效率和增强了聚类结果的可解释性。(本文来源于《计算机科学》期刊2008年09期)

张海玉,刘志都,杨彩,贾松浩[10](2008)在《基于页面聚类的推荐算法的改进》一文中研究指出基于页面聚类的推荐算法常被应用在个性化推荐系统中,但是很少考虑页面访问的顺序性。针对这种弊端,提出了一种新的路径相似度系数,同时在推荐算法中运用了关联规则,提高了推荐结果的准确性。(本文来源于《计算机应用与软件》期刊2008年09期)

页面聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

现有的Web测试是由前端出发,通过分析页面DOM结构来获取状态与状态跳转的条件。但现有技术是将任何DOM节点的改变都认定为产生了新的DOM树,如果对于任何改变DOM结构的操作都认为是新操作来重新生成测试用例会浪费相当的时间和人力。提出一种基于页面DOM相似度的Web应用单元测试方法。利用爬虫程序获取页面状态与相应的DOM结构;利用DOM相似度对DOM进行评价,并对DOM状态进行分类,利用分类簇的中心作为相应功能的操作结果,返回应用中寻找相应的代码块并且进行测试。实验结果表明:该方法可以有效地降低"单一DOM对应单一状态"模式中的冗余状态跳转,可以达到合理的功能发现率,同时有效降低冗余的待测试状态。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

页面聚类论文参考文献

[1].富豪,邓立国.基于ALCIF描述逻辑的Web页面聚类[J].现代计算机.2019

[2].尤枫,张雅峰,赵瑞莲,马金慧.基于页面聚类的Web应用测试方法研究[J].计算机工程与应用.2018

[3].姚瑶,王战红,石磊.一种基于页面聚类的Web概念化建模新方法[J].微电子学与计算机.2015

[4].凌梓.基于本体Web页面聚类的多用户需求发现[J].教师.2014

[5].姚瑶,王战红,石磊.基于页面聚类的Web概念化模型研究[J].科学技术与工程.2014

[6].方杰,张结魁,周军.基于有向带权图的页面聚类算法研究[J].计算机技术与发展.2009

[7].方杰.聚类算法及其在页面聚类中的应用研究[D].合肥工业大学.2009

[8].林文龙,刘业政,余智学.用页组拓扑平均距离改善页面聚类算法[J].计算机科学.2008

[9].谢红薇,颜小林,余雪丽.基于本体的Web页面聚类研究[J].计算机科学.2008

[10].张海玉,刘志都,杨彩,贾松浩.基于页面聚类的推荐算法的改进[J].计算机应用与软件.2008

论文知识图

页面聚类算法准确度比较一6页面聚类结果显示页面聚类结果页面聚类结果日志页面聚类结果页面聚类界面

标签:;  ;  ;  ;  ;  ;  ;  

页面聚类论文_富豪,邓立国
下载Doc文档

猜你喜欢