导读:本文包含了决策树分类挖掘论文开题报告文献综述及选题提纲参考文献,主要关键词:数据挖掘,决策树,ID3算法
决策树分类挖掘论文文献综述
李莉[1](2018)在《数据挖掘技术决策树分类算法(ID3算法)研究》一文中研究指出近些年来,互联网迅速发展,数据量每年都以惊人的幅度提升,人们的生活、政府的管理都和电子信息设备息息相关,特别是电子商务和科学实验数据库的迅速壮大,为我们带来了海量的数据。这些海量的数据中,往往蕴藏非常多有价值的记录和信息,等待着人们去挖掘,人们希望将这些信息分离提取出来进行更高程度的分析和统计,以便为我们所取用。而目前大部分数据库系统仅仅可以实现数据的增、删、改、查,很难找到大数据之间所蕴含的规则和关系,比较缺乏挖掘数据内部价值的有效方法,较难通过数据的维度去探索和发现、预测未来的趋势。本文通过对数据挖掘技术中决策树的分类算法做出实验分析,进行比较,给出合理的分析建议。(本文来源于《电子技术与软件工程》期刊2018年14期)
马俊宏[2](2017)在《数据挖掘技术决策树分类算法分析、比较与实验》一文中研究指出近些年来,互联网迅速发展,数据量每年都以惊人的幅度提升,人们的生活、政府的管理都和电子信息设备息息相关,特别是电子商务和科学实验数据库的迅速壮大,为我们带来了海量的数据。这些海量的数据中,往往蕴藏非常多有价值的记录和信息,等待着人们去挖掘,人们希望将这些信息分离提取出来进行更高程度的分析和统计,以便为我们所取用。而目前大部分数据库系统仅仅可以实现数据的增、删、改、查,很难找到大数据之间所蕴含的规则和关系,比较缺乏挖掘数据内部价值的有效方法,较难通过数据的维度去探索和发现、预测未来的趋势。本文通过对数据挖掘技术中决策树的分类算法做出实验分析,进行比较,给出合理的分析建议。(本文来源于《北京印刷学院学报》期刊2017年07期)
王文霞[3](2017)在《数据挖掘中改进的C4.5决策树分类算法》一文中研究指出针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间.(本文来源于《吉林大学学报(理学版)》期刊2017年05期)
于笑笑[4](2017)在《数据挖掘中的决策树分类》一文中研究指出数据挖掘技术混合了以往传统的数据分析处理方法和处理大量数据的复杂算法,为探寻和分析新的数据类型以及用新方法分析旧有数据类型开辟了宝贵的新天地。数据挖掘被广泛应用于商务、金融、软件、医学、科学与工程等领域。本文对数据挖掘进行介绍,同时对决策树的定义、思想、工作原理及其算法进行介绍。(本文来源于《时代金融》期刊2017年03期)
刘广,孙艳秋,裴媛[5](2016)在《基于C4.5决策树算法的中医胃炎实验数据分类挖掘研究》一文中研究指出C4.5算法是决策树数据挖掘中功能相对比较全面的一种工具。实验对经过预处理后的800例中医胃炎的辨证数据病例采用C4.5算法进行分类,建立中医胃炎辨证分类决策树,并提取决策树中蕴含的分类规则。挖掘出的分类规则基本符合中医胃炎的辨证规律以及名老中医诊治胃炎的诊疗经验。(本文来源于《中华中医药学刊》期刊2016年12期)
李根,樊龙,万定生,余宇峰[6](2016)在《基于Map/Reduce的决策树分类挖掘方法应用研究》一文中研究指出传统数据挖掘模式在处理海量、多维、复杂等特征的数据时,存在计算能力弱、效率低、可扩展性差等问题。论文提出基于Map/Reduce的决策树分类挖掘方法(C4.5BH算法),该算法采用K-means聚类方法对连续属性进行离散化,并利用Map/Reduce编程模型和属性表结构实现了决策树构造过程中属性的并行计算和节点的并行分裂。实验证明,与传统的C4.5算法相比,C4.5BH算法在处理大规模数据集时具有更高的执行效率和良好的加速比。(本文来源于《计算机与数字工程》期刊2016年08期)
黄超[7](2016)在《基于决策树方法的热带云团发展分类及关键因子挖掘研究》一文中研究指出热带云团(Tropical Cloud Cluster, TCC)如何发展成热带气旋(Tropical Cyclone, TC)及其气候特征的研究对TC生成预报至关重要,但与其生成后的研究相比,TCC发展规律的研究较少。数据挖掘是一种新的数据分析技术,过去预测TC生成的统计方法普遍缺乏捕获规律的能力,而数据挖掘能够揭示数据中隐藏的规律,利用其对数据的分析能力建立分类预测模型并结合TC生成的动力学理论从中提取有用的信息,为TC生成研究提供新思路。本文利用决策树算法对TCC是否发展成TC进行分类预测,并从算法中提取影响TCC发展的关键因子,得到以下结论:(1)将TCC能否发展成为TC抽象为二元分类问题,使用CART和C4.5算法根据TC生成前24小时TCC数据对西北太平洋TC生成情况进行预测,并与判别分析的预测结果进行对比。结果表明C4.5算法比CART算法、判别分析的预测准确率高,其训练集准确率为85.69%,测试集为85.03%,能够较好地区分发展类与不发展类TCC的环境场特征。(2)决策树算法发现925hPa散度和700hPa相对涡度是区分发展与不发展TCC非常重要的环境场因子。进一步分析环境场发现,两类TCC的中低层相对涡度、低层与高层散度有显着差异,TCC发展十分依赖相对涡度和散度的配合。此外,算法还发现西北太平洋不同区域的TCC发展有很大的差异,西北太平洋不同区域热带云团生成率(Genesis Productivity, GP)的统计结果表明,NW (Northwestern)区域的GP最高,SE (Southeastern)区域GP域最低。(3)决策树算法中,海温是TCC发展的重要判断条件。夏秋季发展与不发展类TCC所处海温环境差异不显着,大气环境因子是影响其发展的主要因素,海温异常造成的大气环流场异常变化会对TCC发展产生重要影响。将GP分别与Ninno3和EMI指数进行相关分析,结果表明夏秋两季GP与Ninno3指数在SE区均显着正相关,在SW (Southwestern)区仅夏季显着正相关。夏季GP与EMI指数在SE区具有显着正相关关系,而在秋季关系并不显着,并且SCS (South China Sea)区GP与EMI指数在秋季负相关。上述结果表明两类El Nino事件对西北太平洋不同区域TCC发展产生了不同影响。(本文来源于《南京信息工程大学》期刊2016-06-01)
胡新海[8](2015)在《数据挖掘与决策树J48算法在文本分类中的应用》一文中研究指出为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联叁种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值.(本文来源于《甘肃高师学报》期刊2015年05期)
李迎春[9](2015)在《数据挖掘中决策树分类算法的研究》一文中研究指出数据挖掘作为一个应用非常广泛的新兴领域,有很多值得深入研究的问题。分类作为数据挖掘的重要组成部分,更是人们讨论研究的焦点。其中决策树分类算法因其效率较高、结构简单、通俗易懂以及分类精度高等特点广受人们青睐。本文在学习和分析现有数据挖掘理论的基础上,重点研究决策树分类中C4.5算法。主要内容:概述数据挖掘技术、详述分类与决策树技术、详细介绍C4.5算法、改进C4.5算法并将其应用到实例中去。本文的创新点是对C4.5算法进行改进,并应用到作为商业银行决策助手的实际应用中去。主要思路是:针对C4.5算法运行过程中需要进行多次扫描,导致效率不高的缺陷进行改进。共总结提炼出两种改进方式:一是针对类别属性只有正例集和反例集两种的特殊数据集,结合高等数学中泰勒公式和信息增益率的计算特点,提出对属性判别能力度量计算方式进行改进,优化其中的对数运算,提升运行效率;二是对连续属性的处理上的改进,现有的C4.5算法对连续属性处理,是通过将其离散化、排序后,比较所有划分点的信息增益率,从而选择分裂属性,改进算法提出寻找最佳划分点(即边界点)的思路优化划分点的选择,提高算法的运行效率。运用UCI数据集中常见的10组数据集对C4.5算法和改进算法反复进行MATLAB仿真实验,得出结论:改进算法大幅度提高了运行效率,节省了算法的占用空间,同时不会对决策树生成以及测试正确率造成影响。最后,利用改进后的算法对互联网上一家德国银行个人信贷数据进行建模,从实验效果来看,该模型稳定性良好、运行效率高、预测准确率高、占用空间少等优点,符合建模要求,合理可行。(本文来源于《湖南师范大学》期刊2015-05-01)
吴春琼,胡国柱,徐静[10](2015)在《高职院校项目驱动模式下基于数据挖掘决策树分类的教学效果分析》一文中研究指出当前高职院校的学生质量参差不齐。为了适应不同学生的学习水平,引入能够刺激学生积极性的项目驱动教学法。为评估、调整教学方式,采用数据挖掘决策树对教学效果进行分类分析。实验表明数据挖掘技术支持下的项目驱动教学法对教学有良性促进作用。(本文来源于《吕梁教育学院学报》期刊2015年01期)
决策树分类挖掘论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近些年来,互联网迅速发展,数据量每年都以惊人的幅度提升,人们的生活、政府的管理都和电子信息设备息息相关,特别是电子商务和科学实验数据库的迅速壮大,为我们带来了海量的数据。这些海量的数据中,往往蕴藏非常多有价值的记录和信息,等待着人们去挖掘,人们希望将这些信息分离提取出来进行更高程度的分析和统计,以便为我们所取用。而目前大部分数据库系统仅仅可以实现数据的增、删、改、查,很难找到大数据之间所蕴含的规则和关系,比较缺乏挖掘数据内部价值的有效方法,较难通过数据的维度去探索和发现、预测未来的趋势。本文通过对数据挖掘技术中决策树的分类算法做出实验分析,进行比较,给出合理的分析建议。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
决策树分类挖掘论文参考文献
[1].李莉.数据挖掘技术决策树分类算法(ID3算法)研究[J].电子技术与软件工程.2018
[2].马俊宏.数据挖掘技术决策树分类算法分析、比较与实验[J].北京印刷学院学报.2017
[3].王文霞.数据挖掘中改进的C4.5决策树分类算法[J].吉林大学学报(理学版).2017
[4].于笑笑.数据挖掘中的决策树分类[J].时代金融.2017
[5].刘广,孙艳秋,裴媛.基于C4.5决策树算法的中医胃炎实验数据分类挖掘研究[J].中华中医药学刊.2016
[6].李根,樊龙,万定生,余宇峰.基于Map/Reduce的决策树分类挖掘方法应用研究[J].计算机与数字工程.2016
[7].黄超.基于决策树方法的热带云团发展分类及关键因子挖掘研究[D].南京信息工程大学.2016
[8].胡新海.数据挖掘与决策树J48算法在文本分类中的应用[J].甘肃高师学报.2015
[9].李迎春.数据挖掘中决策树分类算法的研究[D].湖南师范大学.2015
[10].吴春琼,胡国柱,徐静.高职院校项目驱动模式下基于数据挖掘决策树分类的教学效果分析[J].吕梁教育学院学报.2015