关联分类论文-李家辉,周忠眉

关联分类论文-李家辉,周忠眉

导读:本文包含了关联分类论文开题报告文献综述及选题提纲参考文献,主要关键词:关联分类,多次学习,关联度,分类准确率

关联分类论文文献综述

李家辉,周忠眉[1](2019)在《基于多次学习和关联度的关联分类改进算法》一文中研究指出基于支持度置信度框架的关联分类算法在生成规则时难以提出大量高质量规则,而且在一些数据集尤其是不平衡数据集上,部分训练实例未被产生的关联规则所覆盖,导致算法的分类准确率不高.基于以上问题提出了改进的关联分类的算法(Improved Algorithm based on Multiple learning and Correlation degree,IAMC).首先,在提取规则时,IAMC对训练集进行多次关联分类学习,尽量多地提出高质量的规则.其次,在生成规则时采用综合考虑了置信度,补类支持度的新度量关联度,以提高生成的规则的质量.最后,在关联分类规则提取后,对利用已有规则无法判断类别的和未被已有规则覆盖的训练实例用决策树方法再次提取规则,并加入到规则集中.实验结果表明,IAMC算法能提出更多高质量的规则,在多个UCI数据集上具有较高的分类准确率.(本文来源于《南京大学学报(自然科学)》期刊2019年04期)

王志昊,冯志华[2](2019)在《基于关联分类的FPGA缺陷检测水平量化方法》一文中研究指出为客观、全面地量化FPGA缺陷检测水平,并以此实现FPGA测试方检测水平比对,在统一的缺陷分类标准基础上,对面向FPGA缺陷的关联分类技术进行研究,借此建立不同项目间统一的水平量化标准,结合马尔科夫链理论,研究针对检测水平变化趋势的分析方法,给出稳定水平量化方法。结合实例,阐述应用该方法的一般步骤,结果验证了该方法在FPGA缺陷检测水平的量化与对比工作上的可行性与有效性。(本文来源于《计算机工程与设计》期刊2019年07期)

秦晨普,张云华[3](2019)在《基于分类修剪的关联分类算法改进》一文中研究指出针对现有关联分类算法资源消耗大、规则剪枝难、分类模型复杂的缺陷,提出了一种基于分类修剪的关联分类算法改进方案ACCP.根据分类属性值的不同对分类规则前项进行分块挖掘,并对频繁项集挖掘过程和规则修剪进行了改进,有效提高了分类准确率和算法运行效率.实验结果表明,此算法改进方案相比传统CBA算法和C4.5决策树算法有着更高的分类准确率,取得了较好的应用效果.(本文来源于《计算机系统应用》期刊2019年04期)

秦晨普[4](2019)在《关联分类算法研究及其在冠心病诊断中的应用》一文中研究指出随着社会经济的发展与物质条件的不断充裕,国民生活方式愈发趋于不健康化。在社会老龄化与城市化不断加速的背景下,以冠心病为代表的心血管疾病近年来在中国的流行趋势明显,已成为居民死亡的首要原因。另一方面,信息技术和物理存储技术的不断发展,也使得医疗诊断的手段越发多样、过程越发复杂,由此积累了海量的医疗数据。如何有效地利用这些数据,发现其中有价值的信息,为疾病的预防与诊断提供参考,具有重要的研究意义。本文的具体研究成果如下:针对现有关联分类算法资源消耗大、规则剪枝难、分类模型复杂的缺陷,提出了一种基于分块挖掘和事先剪枝的关联分类算法改进方案ACCP。根据分类属性值的不同对分类规则前项进行分块挖掘,并对频繁项集挖掘过程和规则修剪过程进行了改进与优化。基于UCI数据集的实验结果表明,此算法改进方案相比传统CBA关联分类算法和C4.5决策树算法有着更好的分类性能,平均分类准确率分别提高了3.93和5.4个百分点,平均灵敏度分别提高了3.95和4.51个百分点,且在算法运行时间上明显优于传统CBA算法,取得了较好的应用效果。针对传统Relief系列算法无法过滤冗余特征的问题,提出了一种基于Relief F算法和互信息的特征选择算法——FSRMI算法。在原有Relief F算法基础上,放弃了通过设定特征权重阈值来剔除无效特征的方式,采用基于互信息的启发式特征约简方法。通过计算特征子集与类别属性的互信息进行特征子集序列前向搜索,并将其是否达到特征全集与类别属性的互信息量作为特征子集生成过程的终止条件。最后,对已生成的特征子集进行基于互信息特征选择的二次约简,通过计算信息度量MIFS去除特征子集中的冗余特征,达到了更好的降维效果。实验结果表明,FSRMI算法在UCI数据集Breast上的特征约简率达到了44.4%,且分类性能相对于特征全集有了进一步的改善。基于实际收集的冠心病数据集,对本文所提出的ACCP关联分类算法与FSRMI特征选择算法在冠心病诊断中的实际应用进行了性能验证。首先对数据集进行数据筛选、缺失值填补以及数据离散化等预处理操作,然后基于FSRMI特征选择算法得到包含有11个特征的特征子集。最后在处理好的冠心病数据集上开展了一系列的对比实验,证明了ACCP关联分类算法在冠心病诊断中的实用性和有效性。除此之外,还基于ACCP分类算法在FSRMI特征选择前后的数据集上分别开展了验证实验,证明了FSRMI特征选择算法可以有效降低特征集的冗余度,具有良好的应用效果。(本文来源于《浙江理工大学》期刊2019-03-05)

郭叔瑾,吴辰文[5](2018)在《基于统计调和平均值的特征加权关联分类算法》一文中研究指出许多学者利用关联分类(Association classification,AC)技术来准确地帮助医生预测乳腺癌疾病,通过应用关联规则来加强分类过程。但大多数AC算法都受到规则评估过程中使用的估计方法以及属性级别的影响。该文提出了一个基于统计调和平均值的特征加权关联分类算法FWAC。通过统计测量技术进行剪枝,生成更准确的关联规则,以提高AC分类器的准确度。将FWAC与5个着名的AC算法(CBA,MMCAR,CARC,FACA和ECBA)在UCI机器学习数据库中的两个乳腺癌数据集上进行比较,实验结果表明,FWAC在该案例研究中优于其他AC算法,能生成更准确的规则。(本文来源于《西北大学学报(自然科学版)》期刊2018年06期)

李家辉,周忠眉[6](2018)在《关联分类及其改进算法综述》一文中研究指出关联分类算法是分类中一个重要的方法,但是基于支持度—置信度框架的传统关联分类算法会产生很多质量不高的规则。为了提高传统关联分类算法的准确率,以提出大量改进算法,综述关联分类及其改进算法。首先介绍关联分类算法及其改进算法所涉及的基本概念,其次就关联分类算法的叁个步骤规则生成、规则度量与剪枝、未知实例预测综述关联分类及其改进算法。最后对关联分类及其改进算法进行总结与展望。(本文来源于《科技通报》期刊2018年08期)

王素琴,吴子锐[7](2019)在《利用LSTM网络和课程关联分类的推荐模型》一文中研究指出在线学习课程数量庞大,存在明显的信息过载问题,个性化智能推荐是解决这一问题的有效方式。根据学习者所学习的课程往往具有时间序列性这一特点,提出了基于LSTM网络的在线课程推荐模型。从大量学习者所学习的课程序列中提取学习行为特点,进而预测学习者将要学习的课程。该算法是基于课程之间的时序性而提出的,因此按照课程之间关系的紧密程度将课程分类后推荐的准确率更高。由于在线课程不断更新,人工维护课程分类的工作量较大,同时分类也不够科学,利用GSP算法和谱聚类算法,挖掘出课程间隐藏的时序联系,提出了更合理的课程自动分类方法。实验结果证明,与传统的协同过滤算法以及基于RNN的课程推荐算法相比,该算法推荐准确度更高。(本文来源于《计算机科学与探索》期刊2019年08期)

苗世强,郑晓势[8](2018)在《关联分类算法的研究与实现》一文中研究指出关联分类算法是对数据进行分析处理中的一个分支。文中结合了关联分类CBA算法,针对数据集样本进行了详细分析。首先,对关联分类中的CBA算法进行了研究,并同步对其实现的代码进行了编写。随后,结合相关数据,运行相关算法进行实现与分析。最终,对该样本数据进行了有效地分类和预测,也完成了算法的有效实现与分析。(本文来源于《智能计算机与应用》期刊2018年02期)

吴桂楠[9](2018)在《频繁特征挖掘的优化与改进关联分类方法的研究》一文中研究指出针对传统关联分类算法中,庞大数据量增长下的规则更新不易、规则冗余需要优化提取等问题,本文提出基于贝叶斯分布动态更新规则与遗传算法选优规则的改进关联分类算法。主要研究如下几点:1、以项变量分布特征为研究基础,把基于频率计算的关联分类频繁集挖掘,转为基于分布下的概率计算与比较问题研究,把关联分类规则更新问题,转为在新增样本数据下,获取项变量贝叶斯分布的频繁集挖掘与规则更新问题研究,以项变量分布参数的先验分布与新增数据的样本分布,动态获取项变量分布参数的后验分布,以后验分布支持频繁集挖掘与规则更新,使频繁集与规则挖掘具有简便、动态和信息表示的多样性。2、对于提取的带有随机不确定性的关联分类规则,研究规则的优选:通过把规则转换为多个前提与结论的随机可能性表示的向量样本形式,进行K-均值聚类,以遗传算法优化聚类数和聚类结果,挑选最优聚类中心,并转换为具有代表性的最优规则,达到关联分类规则的选优。规则选优结果,以检验子集支持验证,遗传优化关联规则过程以Matlab语言自编程实现。3、将本文提出的基于分布的频繁特征挖掘、贝叶斯分布动态更新规则、遗传优化关联规则的方法,应用于高校资产效率管理项目,得到满意的结果,论证了本文方法改进与应用的可行性和有效性。(本文来源于《华南理工大学》期刊2018-04-20)

吴辰文,郭叔瑾,李晨阳[10](2018)在《结合高斯混合模型的关联分类离散化算法研究》一文中研究指出大多数以规则为基础的分类不能直接处理像血压这一类连续数据.离散化数据预处理可以将连续的数据转变成分类格式.现有的离散化算法没有考虑到数据集中连续变量的多模态分类密度,这可能会降低以规则为基础的分类器性能.提出一种新的基于高斯混合模型的离散化算法(Discretization Algorithm based on Gaussian Mixture Model,DAGMM),通过考虑连续变量的多峰分布以保留数据的原始模式.DAGMM算法的有效性通过4个公开可用的医疗数据集进行验证.实验结果表明,在产生的规则数和关联分类算法的分类准确度方面,DAGMM算法优于其它6个静态离散化算法.因此,在临床专家系统中运用此方法,有潜力提高以规则为基础的分类器的性能.(本文来源于《小型微型计算机系统》期刊2018年04期)

关联分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为客观、全面地量化FPGA缺陷检测水平,并以此实现FPGA测试方检测水平比对,在统一的缺陷分类标准基础上,对面向FPGA缺陷的关联分类技术进行研究,借此建立不同项目间统一的水平量化标准,结合马尔科夫链理论,研究针对检测水平变化趋势的分析方法,给出稳定水平量化方法。结合实例,阐述应用该方法的一般步骤,结果验证了该方法在FPGA缺陷检测水平的量化与对比工作上的可行性与有效性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

关联分类论文参考文献

[1].李家辉,周忠眉.基于多次学习和关联度的关联分类改进算法[J].南京大学学报(自然科学).2019

[2].王志昊,冯志华.基于关联分类的FPGA缺陷检测水平量化方法[J].计算机工程与设计.2019

[3].秦晨普,张云华.基于分类修剪的关联分类算法改进[J].计算机系统应用.2019

[4].秦晨普.关联分类算法研究及其在冠心病诊断中的应用[D].浙江理工大学.2019

[5].郭叔瑾,吴辰文.基于统计调和平均值的特征加权关联分类算法[J].西北大学学报(自然科学版).2018

[6].李家辉,周忠眉.关联分类及其改进算法综述[J].科技通报.2018

[7].王素琴,吴子锐.利用LSTM网络和课程关联分类的推荐模型[J].计算机科学与探索.2019

[8].苗世强,郑晓势.关联分类算法的研究与实现[J].智能计算机与应用.2018

[9].吴桂楠.频繁特征挖掘的优化与改进关联分类方法的研究[D].华南理工大学.2018

[10].吴辰文,郭叔瑾,李晨阳.结合高斯混合模型的关联分类离散化算法研究[J].小型微型计算机系统.2018

标签:;  ;  ;  ;  

关联分类论文-李家辉,周忠眉
下载Doc文档

猜你喜欢