导读:本文包含了挖掘算法论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:算法,数据挖掘,规则,多维,数据,收割机,神经网络。
挖掘算法论文文献综述
周永章,王俊,肖凡,沈文杰,余晓彤[1](2019)在《地质大数据挖掘与机器学习算法在矿床学研究中的应用》一文中研究指出在大数据时代,地质大数据挖掘具有极端重要性,对机器学习算法应用的需求变得特别迫切。已有着作建立了地球科学大数据挖掘与机器学习的基本框架,包括高维数据降维、分类与预测、大图形社区结构识别、无限流数据处理、机器学习及人工智能地质学的建模过程,对必要的应用场景,使用Python语言给出案例(周永章等,2018)。在机器学习中,SVM是一种比较有代表性的方法。它的基础是二元分类算法,核心思维是升维和线性(本文来源于《第九届全国成矿理论与找矿方法学术讨论会论文摘要集》期刊2019-12-13)
石慧,陈恩[2](2019)在《Spark平台的分布式阶段自适应关联规则挖掘算法》一文中研究指出为满足日益增长的海量数据挖掘需求,迫切需要设计一种能够在多台机器上运行的分布式关联规则挖掘算法。Apriori这种高度迭代算法在Hadoop平台上运行时每次迭代执行大量的磁盘I/O操作,大大影响并限制了算法的运行效率。本文利用Spark对分布式计算内置支持的特点,在Spark平台上设计并实现一种分布式关联规则挖掘算法,称为阶段式自适应挖掘算法(Staged Adaptive Apriori)。算法使用自适应的数据集部分处理的策略对频繁项集进行高效挖掘,在每次迭代前初步评估执行时间,并采用较为合适的方法来减少时间和空间的复杂性,是一种基于数据集性质的自适应关联规则挖掘算法。实验结果表明了算法的有效性。(本文来源于《计算机与现代化》期刊2019年12期)
高林,高尚飞[3](2019)在《大数据挖掘算法在刷卡中的研究与应用》一文中研究指出面对海量的刷卡交易数据,普通的聚类算法和自然语言处理无法完成数据挖掘任务。本研究将MapReduce与K-means、FCM及HanLP算法相结合,不仅提高了海量数据聚类和语句分析的效率,而且可以挖掘出海量用户的刷卡行为特点,丰富和完善了客户画像。经过实验测试,基于MapReduce的聚类和自然语言分析算法运行在Hadoop集群下,不仅快速地实现了客户画像,帮助企业实现精准推销,而且为大数据环境下实现数据挖掘及自然语言分析算法的分布式并行运算提供了重要的参考和应用价值。(本文来源于《青岛科技大学学报(自然科学版)》期刊2019年06期)
阎婷,吴文华,严丽娜,万征[4](2019)在《基于C-D的关联规则兴趣度挖掘算法》一文中研究指出传统的关联规则算法是针对关联关系计算它们的支持度和置信度来判断它们的关联程度,看它们之间是否具有很好的兴趣度。这里给出一种新的计算关联规则兴趣度的方法——基于坐标的距离关联规则兴趣度挖掘方法。此方法是一种基于坐标的关联规则度量方法,利用关联规则在坐标中的位置和坐标中关联规则的极限位置,根据距离的大小度量兴趣度大小。算法采用SQL SERVER作为存放数据库,以VC++作为开发环境,对新兴趣度进行测试,验证了算法的正确性。(本文来源于《通信技术》期刊2019年12期)
吴东林,张玉华[5](2020)在《收割机远程监测系统的设计——基于云平台数据挖掘并行算法》一文中研究指出随着农业自动化技术的不断发展,无人驾驶收割机被逐渐应用到农业生产中,由于其远程监测和控制技术还不成熟,还无法达到完全无人化作业的水平。为了实现收割机的完全无人化作业,需要提高远程监测系统的实时监测效率。为此,将云平台数据挖掘和并行算法引入到了远程监测系统的设计上,通过对漏收率、破损率的实时监测来提高收割机自主作业水平。为了验证方案的可行性,对收割机远程监测系统的性能进行了测试,结果表明:收割机远程监测系统可以有效地提高播种机的作业效率和质量,对于提高其无人化作业的自动化程度具有重要的意义。(本文来源于《农机化研究》期刊2020年06期)
陈海军[6](2019)在《基于Apriori数据挖掘算法的信息推荐图书管理系统设计》一文中研究指出传统应用于图书管理系统的Apriori算法因数据库扫描次数过多,以及候选项集数量过大导致系统运行缓慢,为解决此问题,设计基于改进Apriori数据挖掘算法的信息推荐图书管理系统。系统结合C/S架构与B/S架构,分别向图书馆工作人员和借阅者开放图书信息。系统功能模块中数据预处理子模块从读者借阅数据库中提取借阅者以及图书相关信息数据,对数据进行清洗、转换以及集成处理后,关联规则挖掘子模块利用改进Apriori算法依据处理后的数据,挖掘出支持度大于最小支持度阈值以及置信度大于最小置信度阈值的强关联规则,生成关联规则数据库。个性化信息推荐子模块依据关联规则数据库中的借阅者同借阅者所选图书进行关联匹配,向借阅者推送与所读图书相关联图书信息,实现图书信息的个性化推荐。实验结果表明,该系统可有效推荐图书关联信息,且在50个客户端同时运行的情况下CPU占有率仅为6.58%,运行性能佳。(本文来源于《现代电子技术》期刊2019年23期)
宋鹏[7](2019)在《基于大数据挖掘的多维数据去重聚类算法分析》一文中研究指出数据产生的渠道越来越多,速度越来越快,大量的数据为数据分析和处理带来了较大的难度,云平台中的数据种类和规模也在不断扩大,超大的数据规模给数据的存储、管理、分析等带来了前所未有的挑战。数据量剧增会导致数据的可靠性不足,如何有效地处理数据之间的关系,降低冗余数据,建立多维数据去重聚类模型是业界共同努力的方向。文中最先介绍了在大数据挖掘下的多维聚类算法,通过分析大数据内部之间的关系,建立一种适合大数据处理的多维数据去重聚类算法分析模型,对该算法进行改进和实验分析,得到该算法在采样时所存在的复杂度较低,数据分析的结果准确,有利于实现数据的分析和处理,减少数据的冗余,增加数据分析的效率,具有良好的判定效果。(本文来源于《现代电子技术》期刊2019年23期)
杨文伟,蒋良芝,李春燕,汪可可[8](2019)在《常见的数据挖掘算法及其在医院内感染中的应用》一文中研究指出2002年WHO进行的一项调查发现,在14个国家的55家医院中住院患者医院内感染发生率高达8.5%。医院内感染已成为全球性公共卫生问题,其可由多种病原微生物引起,存在于临床治疗的各个环节,是影响医疗质量提升的重要因素,制约着现代医疗技术的应用和医院的发展[1]。如何早期发现并及时控制医院内感染事件的发生已成为关键问题。医学领域数据生成速度快,数据量大,数据结构具有复杂性和多样性,数据应用价值高,传统的学习方式已不能对医疗数据进(本文来源于《现代医药卫生》期刊2019年22期)
吴佳静[9](2019)在《中医方剂数据挖掘关键算法》一文中研究指出本文调研了国内外中医方剂的研究现状并运用数据挖掘技术进行中医方剂数据提取,本文主要完成的工作如下:(1)数据标准化建模。由于现有中医方剂记载中,方剂数据名称、用药量标准、药品名称不一致,在中医方剂领域数据统一性及完整性方面造成了很多障碍。因此,在进行数据建模之前必须对原始数据采集进行数据规范化处理。(2)利用文本抽取、关系数据转换以及数据融合等技术,探索中医药数据挖掘构建方法与标准化流程,实现中医药知识的智能应用。(本文来源于《电子技术与软件工程》期刊2019年22期)
韩天鹏,王峰[10](2019)在《一种基于本地分区的挖掘算法研究》一文中研究指出在频繁项集挖掘中减少数据库扫描次数是核心工作之一.本文提出一种利用本地支持信息来计算频繁项集的改进分区方法,在此基础上只需对数据库扫描一次.由于改进算法不进行第二次数据库扫描,仅使用从分区获得的本地支持的原因,使得频繁项集的挖掘准确率有一定的误差,但实验结果表明,误差在可控范围内.改进算法与Apriori、FP-growth和Partition算法相比,总体时间复杂度得到降低;内存使用和数据库访问时间减少,有一定的优越性.(本文来源于《赤峰学院学报(自然科学版)》期刊2019年11期)
挖掘算法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为满足日益增长的海量数据挖掘需求,迫切需要设计一种能够在多台机器上运行的分布式关联规则挖掘算法。Apriori这种高度迭代算法在Hadoop平台上运行时每次迭代执行大量的磁盘I/O操作,大大影响并限制了算法的运行效率。本文利用Spark对分布式计算内置支持的特点,在Spark平台上设计并实现一种分布式关联规则挖掘算法,称为阶段式自适应挖掘算法(Staged Adaptive Apriori)。算法使用自适应的数据集部分处理的策略对频繁项集进行高效挖掘,在每次迭代前初步评估执行时间,并采用较为合适的方法来减少时间和空间的复杂性,是一种基于数据集性质的自适应关联规则挖掘算法。实验结果表明了算法的有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
挖掘算法论文参考文献
[1].周永章,王俊,肖凡,沈文杰,余晓彤.地质大数据挖掘与机器学习算法在矿床学研究中的应用[C].第九届全国成矿理论与找矿方法学术讨论会论文摘要集.2019
[2].石慧,陈恩.Spark平台的分布式阶段自适应关联规则挖掘算法[J].计算机与现代化.2019
[3].高林,高尚飞.大数据挖掘算法在刷卡中的研究与应用[J].青岛科技大学学报(自然科学版).2019
[4].阎婷,吴文华,严丽娜,万征.基于C-D的关联规则兴趣度挖掘算法[J].通信技术.2019
[5].吴东林,张玉华.收割机远程监测系统的设计——基于云平台数据挖掘并行算法[J].农机化研究.2020
[6].陈海军.基于Apriori数据挖掘算法的信息推荐图书管理系统设计[J].现代电子技术.2019
[7].宋鹏.基于大数据挖掘的多维数据去重聚类算法分析[J].现代电子技术.2019
[8].杨文伟,蒋良芝,李春燕,汪可可.常见的数据挖掘算法及其在医院内感染中的应用[J].现代医药卫生.2019
[9].吴佳静.中医方剂数据挖掘关键算法[J].电子技术与软件工程.2019
[10].韩天鹏,王峰.一种基于本地分区的挖掘算法研究[J].赤峰学院学报(自然科学版).2019