导读:本文包含了属性关联贝叶斯论文开题报告文献综述及选题提纲参考文献,主要关键词:连续型数据,数据分类,关联规则,朴素贝叶斯分类算法
属性关联贝叶斯论文文献综述
宁可,孙同晶,赵浩强[1](2018)在《基于属性关联的朴素贝叶斯分类算法》一文中研究指出针对传统朴素贝叶斯分类算法处理多维连续型数据时准确率较低的问题,提出基于属性关联的改进算法。通过高斯分割对属性类别不同的多维连续型数据集进行离散化处理,并使用拉普拉斯校准、属性关联和属性加权方法改进朴素贝叶斯分类过程。实验结果表明,与基于拉普拉斯校准或属性加权的改进算法相比,该算法能够提高分类准确率,且提升幅度在一定范围内随着属性数量的增加而增加,适用于多维连续型数据的分类。(本文来源于《计算机工程》期刊2018年06期)
王晓龙[2](2014)在《基于关联规则属性约简的树增广朴素贝叶斯分类器及应用》一文中研究指出在步入21世纪之后,社会的经济文化得到了迅速发展,人们的生活水平也得到逐步的提高。世界各国的人们开始越来越关注自身的健康问题,这对当今的医疗领域提出了更高的要求。同时,随着人工智能领域的卓越发展和医疗技术不断的进步,在多领域技术融合的潮流之下,电脑辅助医疗诊断技术成为了众多学者们的研究焦点之一。贝叶斯网络是常见的知识表达和推理工具中之一,是人工智能的重要研究领域,被全世界众多学者所研究并广泛应用于各个领域。贝叶斯网络是一个有向无环图,并结合概率论来表达各个变量之间的因果关系。贝叶斯网络具有简单的结构和完备清晰的语义,其在辅助医疗诊断方面也有着广泛的应用。但是在贝叶斯网络的学习结构之时,数据集的属性数量越多,网络结构学习的复杂度越大,得到网络结构也会更加复杂。且构造与给定数据最佳拟合网络结构是一个NP-HARD问题。如果能够对数据集做适当的属性约减,就可以得到简化的贝叶斯网络结构,这对于在辅助医疗诊断方面有着重要的意义,即使用较少的信息和时间也可得到较高的诊断精度。本文首先提出了一种基于关联规则的属性约减的贝叶斯方法AD-TAN(theAssociation rules based Tree Augmented Naive bayes)。该方法根据每个待分类实例的特性来动态的确定用于该实例的训练集,这个过程主要是是通过删除缺失值及其对应的缺失属性来完成。通过论证关联规则与数据库中的函数依赖发现,关联规则在某种情况下与数据库中的函数依赖有着共同的特性。将这些特性应用在发现属性之间的关系,可以找出那些可以移除的属性。通过关联规则挖掘,发现挖掘出的关联规则集中,处于规则的后件的那些属性可用于属性约减。于是提出了基于动态训练集选择和基于关联规则属性约减的TAN方法,即AD-TAN方法。由于在TAN树形结构上,利用AD-TAN中的关联规则去除冗余属性,在构建TAN网络结构时实际上是将树形结构某条路径上的某个节点删除,而路径上的其他节点不变。通过对概率规则的研究和推导,得出了可用于属性约减的重要结论,这些推导的依据是Armstrong公理。通过这些结论可以发现,那些通过关联规则挖掘出来的冗余属性,处于贝叶斯网络结构上的某条路径之中,从该属性开始到该路径的叶子节点为止的这些节点都可以作为冗余节点集的候选节点。最后将概率规则推导的结论和关联规则特性相结合,找出关联规则指出的那些节点及其在树型结构的所有子孙节点作为可能的冗余节点。这些可能的冗余节点对分类的精度可能产生影响,本文通过迭代的方法来逐层删除节点,并引入参数加以控制。基于此,提出了IC-TAN方法(Iterative Control Method Basedon AD-TAN with adding and deleting Attributes,基于AD-TAN的带有属性加减的迭代控制方法)。IC-TAN方法可应用在辅助医疗诊断领域,利用该方法,医生可以在较短的时间内,利用较少的信息为患者进行疾病诊断。IC-TAN方法的利用每个实例具体情况的特性正好与医生诊断的过程与特点相符合。利用该方法可以辅助医生进行快速准确的诊断。为了验证IC-TAN的分类效果,本文实验采用16个UCI数据集,并与NB和TAN及带有属性选择的SNB-CFS和TAN-IGS做了精度对比。实验表明,IC-TAN有着更好的分类效果,且需要较少的信息。(本文来源于《吉林大学》期刊2014-05-01)
属性关联贝叶斯论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在步入21世纪之后,社会的经济文化得到了迅速发展,人们的生活水平也得到逐步的提高。世界各国的人们开始越来越关注自身的健康问题,这对当今的医疗领域提出了更高的要求。同时,随着人工智能领域的卓越发展和医疗技术不断的进步,在多领域技术融合的潮流之下,电脑辅助医疗诊断技术成为了众多学者们的研究焦点之一。贝叶斯网络是常见的知识表达和推理工具中之一,是人工智能的重要研究领域,被全世界众多学者所研究并广泛应用于各个领域。贝叶斯网络是一个有向无环图,并结合概率论来表达各个变量之间的因果关系。贝叶斯网络具有简单的结构和完备清晰的语义,其在辅助医疗诊断方面也有着广泛的应用。但是在贝叶斯网络的学习结构之时,数据集的属性数量越多,网络结构学习的复杂度越大,得到网络结构也会更加复杂。且构造与给定数据最佳拟合网络结构是一个NP-HARD问题。如果能够对数据集做适当的属性约减,就可以得到简化的贝叶斯网络结构,这对于在辅助医疗诊断方面有着重要的意义,即使用较少的信息和时间也可得到较高的诊断精度。本文首先提出了一种基于关联规则的属性约减的贝叶斯方法AD-TAN(theAssociation rules based Tree Augmented Naive bayes)。该方法根据每个待分类实例的特性来动态的确定用于该实例的训练集,这个过程主要是是通过删除缺失值及其对应的缺失属性来完成。通过论证关联规则与数据库中的函数依赖发现,关联规则在某种情况下与数据库中的函数依赖有着共同的特性。将这些特性应用在发现属性之间的关系,可以找出那些可以移除的属性。通过关联规则挖掘,发现挖掘出的关联规则集中,处于规则的后件的那些属性可用于属性约减。于是提出了基于动态训练集选择和基于关联规则属性约减的TAN方法,即AD-TAN方法。由于在TAN树形结构上,利用AD-TAN中的关联规则去除冗余属性,在构建TAN网络结构时实际上是将树形结构某条路径上的某个节点删除,而路径上的其他节点不变。通过对概率规则的研究和推导,得出了可用于属性约减的重要结论,这些推导的依据是Armstrong公理。通过这些结论可以发现,那些通过关联规则挖掘出来的冗余属性,处于贝叶斯网络结构上的某条路径之中,从该属性开始到该路径的叶子节点为止的这些节点都可以作为冗余节点集的候选节点。最后将概率规则推导的结论和关联规则特性相结合,找出关联规则指出的那些节点及其在树型结构的所有子孙节点作为可能的冗余节点。这些可能的冗余节点对分类的精度可能产生影响,本文通过迭代的方法来逐层删除节点,并引入参数加以控制。基于此,提出了IC-TAN方法(Iterative Control Method Basedon AD-TAN with adding and deleting Attributes,基于AD-TAN的带有属性加减的迭代控制方法)。IC-TAN方法可应用在辅助医疗诊断领域,利用该方法,医生可以在较短的时间内,利用较少的信息为患者进行疾病诊断。IC-TAN方法的利用每个实例具体情况的特性正好与医生诊断的过程与特点相符合。利用该方法可以辅助医生进行快速准确的诊断。为了验证IC-TAN的分类效果,本文实验采用16个UCI数据集,并与NB和TAN及带有属性选择的SNB-CFS和TAN-IGS做了精度对比。实验表明,IC-TAN有着更好的分类效果,且需要较少的信息。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
属性关联贝叶斯论文参考文献
[1].宁可,孙同晶,赵浩强.基于属性关联的朴素贝叶斯分类算法[J].计算机工程.2018
[2].王晓龙.基于关联规则属性约简的树增广朴素贝叶斯分类器及应用[D].吉林大学.2014