导读:本文包含了数据挖掘工具论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数据挖掘,工具,算法,数据,织机,建模,特征。
数据挖掘工具论文文献综述
张邈[1](2019)在《统计行业数据分析与数据挖掘工具应用》一文中研究指出现阶段,随着网络信息技术的蓬勃发展,人们越来越重视对数据的收集、整理、分析以及应用,通过对数据进行一系列加工处理,使得数据在推动社会进步和改善人们生活方面的作用不断凸显。在大数据时代,数据的价值被无限放大,数据分析的水平不断提高,数据挖掘的工具不断更新。基于此,笔者主要对统计行业数据分析与数据挖掘工具的相关内容进行阐述,希望能够为有关单位和相关人员开展工作提供借鉴。(本文来源于《信息与电脑(理论版)》期刊2019年19期)
曲智丽,张海,杨絮[2](2019)在《当前流行教育数据挖掘与学习分析工具概览》一文中研究指出近年来,为进行教育数据挖掘(EDM)、学习分析(LA)研究,国内外的研究者研发了大量的工具。本文将重点介绍一些对教育数据挖掘和学习分析感兴趣的研究人员使用的最广泛、最容易访问和最强大的工具。首先是叁种非常适合数据的操作、清理及创建的工具:Microsoft Excel、Google Sheets和EDM工作台。接下来讨论Python和SQL在编(本文来源于《中国信息技术教育》期刊2019年06期)
杨忠诚[3](2018)在《数据挖掘工具WEKA及其应用研究》一文中研究指出数据挖掘、知识发现和机器学习的研究取得了瞩目的成果,一大批算法和数据集层出不穷,为让研究者简单、有效地测试新的算法和数据,开源工具WEKA提供了一个优秀的测试和开发平台。目前, WEKA已成为数据挖掘研究领域最常用的工具。文章详细介绍WEKA平台的使用方法,并介绍在WEKA社区内一些成熟的应用模块。(本文来源于《企业科技与发展》期刊2018年09期)
许京[4](2018)在《利用数据挖掘工具分析喷气织机生产数据》一文中研究指出基于喷气织机生产监控系统采集的数据建立数据仓库,探讨数据清理、数据变换及规范化、数据仓库的组建等组织数据仓库问题。从挖掘分析的目标、织机监控的数据模型、数据挖掘工具和分析等方面介绍数据挖掘方法,并总结数据挖掘的步骤。结果表明,利用SQL数据挖掘工具对喷气织机生产数据进行分析,可得出各影响因素对喷气织机的影响程度,有效提高喷气织机的效率。(本文来源于《天津纺织科技》期刊2018年02期)
斯特凡·斯莱特,斯万克·约克西莫维奇,维特梅·科万诺维奇,莱恩·贝克,德拉甘·加斯维奇[5](2018)在《教育数据挖掘工具综述》一文中研究指出数据挖掘拥有悠久的历史,它可以追溯到探索性数据分析(Tukey,1977),且目前已经形成了有效的、可推广的方法。本文将讨论教育数据挖掘研究与实践中逐渐兴起的一些工具,以及在更广泛的层面上数据挖掘和数据科学研究者所使用的相关工具,近40种教育领域数据挖掘与分析的常用工具,包括数据处理与特征工程工具、算法分析工具、可视化效果工具,以及EDM和LA的特殊应用,如贝叶斯知识跟踪工具、文本挖掘、社会网络分析、过程与序列挖掘、PSLC服务站等。本文将为初次接触这一领域的研究者提供有用的信息,以帮助他们找到有用的工具。(本文来源于《开放学习研究》期刊2018年01期)
程代娣[6](2017)在《Clementine数据挖掘工具在计算机等级考试成绩中的应用》一文中研究指出影响成绩的因素很多,针对高校计算机等级考试支持偏低的现状,早期采用传统的决策树人工算法效率低,提出可视化数据挖掘工具SPSS Clementine技术,利用该技术中的决策树算法对近叁年学生计算机等级成绩进行分析,快速建立了成绩分析决策树模型,找出影响成绩的潜在因素,为学生学习和个性化教学提供参考。(本文来源于《齐鲁工业大学学报》期刊2017年06期)
李健,王小蒙[7](2017)在《基于R语言的数据挖掘工具的设计》一文中研究指出本文是基于R语言工具对于数据加载模块实现的常用几种数据加载方式进行的一个总结,让用户对数据挖掘有一个更为直观的了解。在分析设置过程中主要实现聚类分析、关联分析、决策树和随机森林的算法;在评价模块中用户可以对建立的模型进行评价,希望对读者有所帮助。(本文来源于《内蒙古科技与经济》期刊2017年24期)
陈宇轩[8](2016)在《面向大数据挖掘的多任务跨平台可视化作业工具研究》一文中研究指出近年来,大数据与云计算产业获得了蓬勃发展,但大数据挖掘引擎还受限于其专业化的使用方式而产生了技能门槛,同时移动终端的普及使人们的工作环境不再固定。在集群常为多用户共享的情况下,单个任务常占用大量的计算资源,而多任务对同一数据进行挖掘将不可避免地产生重复运算,从而带来了调度灵活性不高、资源闲置、处理效率低等方面的问题,而现有的大数据挖掘引擎尚未对此进行优化,从而限制了大数据挖掘引擎的应用。针对以上问题,在不改变现有大数据挖掘引擎的基础上,本文设计并实现了一种面向大数据挖掘的多任务跨平台可视化作业工具,分析了大数据挖掘在多任务场景下的跨平台可视化需求与存在的问题,并给出了相应的解决方案。本文的主要研究工作归纳如下:(1)针对当前大数据挖掘引擎的易用性差的问题,设计并实现了跨平台可视化前端操作界面。实现了采用可视化工作流模型的数据挖掘工作台、分布式文件系统(Hadoop Distributed File System,HDFS)可视化管理组件以及Web-Shell远程命令行组件,为用户提供了灵活的操作方式及可视化支持,具有较强的跨平台特性,解决了当前大数据挖掘引擎的易用性差的问题。(2)针对当前大数据挖掘引擎在多任务场景下的任务调度灵活性差与资源利用率问题,提出并实现了任务拆分提交调度方案。通过对可视化建模生成的工作流进行拆分,使子任务的资源需求降低,从而提升任务调度的灵活性,解决了当前大数据挖掘引擎在多任务场景下任务调度灵活性问题与资源利用率问题。(3)针对当前大数据挖掘引擎在多任务场景下的重复运算问题,提出并实现了任务去重及弹性资源配置方案,通过中间结果复用与弹性资源配置有效提高任务处理效率,解决了当前大数据挖掘引擎在多任务场景下的重复运算问题。理论分析与实验对比表明,本文实现的面向大数据挖掘的多任务跨平台可视化作业工具在不改变当前大数据挖掘引擎的前提下,能够有效降低对用户的技能门槛,提供灵活的使用方式以及良好的用户体验,同时在多任务应用场景下有效提升了任务调度灵活性以及集群资源利用率与任务处理效率,弥补了现有大数据挖掘引擎的不足。(本文来源于《武汉理工大学》期刊2016-04-01)
王鹏[9](2016)在《基于流程的数据挖掘生成工具的设计与实现》一文中研究指出随着数据挖掘知识的普及,数据挖掘已经在社会各行各业的应用迅速扩展开来。通俗来讲,数据挖掘就是从大量的数据中,提取人们感兴趣的,即正确的、未知的、有潜在价值的并最终能被用户接收和利用的知识。数据挖掘已经广泛地应用于各个领域,越来越多的学者开始关注于数据挖掘领域。随着数据挖掘相关知识在越来越多的领域开始普及,其相关的实用工具也开始受到人们的重视。数据挖掘的研究重点也慢慢向数据挖掘系统工具方向转移,越来越注重多种多样的发现策略和技术的集成。数据挖掘工具的用户主要集中在一些传统的行业中,比如银行、制造业、销售等面临转型的行业,数据挖掘工具也在不断的产生和完善。基于上述的场景和需求,本文研究并设计了一套基于流程的数据挖掘建模工具。该工具提供了一种基于web服务的流程建模方式,旨在为流程开发者提供一个统一的建模平台,减少开发者的工作量,满足不同开发者的动态需求。基于流程的数据挖掘建模方式借助于web服务,通过将第叁方服务进行组装形成新的流程来满足开发者的任务需求。这种开发方式的优点在于开发者不需要过多地了解数据挖掘的相关知识,完全屏蔽了底层数据挖掘服务实现的细节,只需要调用相关的基于数据挖掘的web服务,调用服务对外提供的接口,对这些服务进行组装,就能实现数据挖掘流程的搭建。该工具可显着提升建模效率,对IT人员也可以大大减轻原有的IT支持代价,提升调度和数据运作效率。开发者可以自定义建模过程中每个步骤的细节,并能够实时跟踪流程的执行情况。为了进一步减少开发人员的工作量,本系统为开发者提供了用于流程搭建的服务库。将数据挖掘流程中常用到的数据预处理、挖掘算法、算法评估等任务进行封装,以服务模板的形式提供给开发人员调用。借助于系统提供的服务库,开发人员可以完成从数据输入、数据拼接、特征抽取、模型训练、模型评估、模型应用完整的建模过程,显着提升流程建模效率。开发人员在搭建数据挖掘流程时,可以选择导入第叁方服务,也可以调用系统提供服务,极大地增加了流程开发的灵活性。本文首先阐述了数据挖掘建模系统的背景和意义,并研究系统所设计的相关技术和领域。接着从本文的整体目标出发,分析了数据挖掘建模系统的功能性需求,根据需求对系统的总体架构和模块间的交互接口进行了设计,针对核心模块的实现进行详细介绍。最后对系统进行了测试,以验证系统的合理性。(本文来源于《北京邮电大学》期刊2016-01-08)
冯超[10](2015)在《数据挖掘工具在疾病危险因素和治疗方法中的应用研究》一文中研究指出目的:本文主要是做了疾病危险因素和治疗方法的共现矩阵,并以此为数据对象,利用R和Weka做K-Means分析,用SPSS中的判别分析对比评价R和Weka的适合性。面向四种数据挖掘方法做了对比分析,分析了其优势、劣势,以及适用范围,并提出了协同应用的可行性,帮助研究者选择数据挖掘方法。方法:选取早于2015年的Web of ScienceTM核心数据集中有关肌萎缩性侧索硬化症(ALS)疾病危险因素和治疗方法的文献,下载全信息,做数据预处理,筛选高频关键词,再于Web of Science全部数据库中,以高频关键词和肌萎缩性侧索硬化症为主题词检索出文献量。做危险因素和治疗方法的共现矩阵,以此为数据挖掘对象,以数据挖掘理论为基础,以数据挖掘方法为手段,以R和Weka为平台和环境,对其进行数据分析和挖掘。并利用SPSS内的判定分析,对基于R和Weka的肌萎缩性侧索硬化症的危险因素和治疗方法共现矩阵K-Means分析做对比评价,判断更适用者。结果:(1)根据四种数据挖掘方法的原理和特性,以及在医学领域的应用现状,做了对比分析,并分析了四种数据挖掘方法在医学领域的适用范围和协同应用的可行性。(2)比较四种数据挖掘方法的优势、劣势,明确数据挖掘方法可以用于医学数据的分析,针对不同的分析内容、数据特点、分析的目的,选择合适的数据挖掘方法。(3)通过ALS的危险因素和治疗方法共现矩阵,发现其两两共现情况,明确关联强度,可以为基础实验和临床研究提供提示。(4)对肌萎缩侧索硬化症的致病危险因素和治疗方法共现矩阵做K‐Means分析,发现类内有关联,可在作用机制上有关联,可以作为提示类内没有发现的机制或其他关联,提供参考和预测。(5)利用SPSS中的判别分析功能,评价在ALS的危险因素和治疗方法共现矩阵K-Means分析中,R比Weka更有适用性,帮助工具选择。结论:(1)对比分析数据挖掘方法从而做出对方法的选择,为研究者做相关研究提供帮助。数据挖掘方法可以在一定程度上考虑协同应用,强化效果或弥补缺陷。(2)通过疾病危险因素和治疗方法共现矩阵,可发现危险因素间和治疗方法间的关联强度及其研究现状。(3)R和Weka作为国内外备受青睐且功能强大的数据分析软件,有着它们各自的优势。但其面向不同的数据对象、目的需求、用户时有不同的适应性,应根据自身情况选取更适合的工具。本研究中R和Weka的分类结果不同,利用SPSS做判别分析,发现在疾病危险因素和治疗方法共现矩阵的K-Means分析上R比Weka更具适用性。(本文来源于《吉林大学》期刊2015-06-01)
数据挖掘工具论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来,为进行教育数据挖掘(EDM)、学习分析(LA)研究,国内外的研究者研发了大量的工具。本文将重点介绍一些对教育数据挖掘和学习分析感兴趣的研究人员使用的最广泛、最容易访问和最强大的工具。首先是叁种非常适合数据的操作、清理及创建的工具:Microsoft Excel、Google Sheets和EDM工作台。接下来讨论Python和SQL在编
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据挖掘工具论文参考文献
[1].张邈.统计行业数据分析与数据挖掘工具应用[J].信息与电脑(理论版).2019
[2].曲智丽,张海,杨絮.当前流行教育数据挖掘与学习分析工具概览[J].中国信息技术教育.2019
[3].杨忠诚.数据挖掘工具WEKA及其应用研究[J].企业科技与发展.2018
[4].许京.利用数据挖掘工具分析喷气织机生产数据[J].天津纺织科技.2018
[5].斯特凡·斯莱特,斯万克·约克西莫维奇,维特梅·科万诺维奇,莱恩·贝克,德拉甘·加斯维奇.教育数据挖掘工具综述[J].开放学习研究.2018
[6].程代娣.Clementine数据挖掘工具在计算机等级考试成绩中的应用[J].齐鲁工业大学学报.2017
[7].李健,王小蒙.基于R语言的数据挖掘工具的设计[J].内蒙古科技与经济.2017
[8].陈宇轩.面向大数据挖掘的多任务跨平台可视化作业工具研究[D].武汉理工大学.2016
[9].王鹏.基于流程的数据挖掘生成工具的设计与实现[D].北京邮电大学.2016
[10].冯超.数据挖掘工具在疾病危险因素和治疗方法中的应用研究[D].吉林大学.2015