导读:本文包含了联机挖掘论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:数据挖掘,多维,数据仓库,规则,数据库,立方体,数据。
联机挖掘论文文献综述
吴湘宁[1](2014)在《地质环境数据仓库联机分析处理与数据挖掘研究》一文中研究指出改革开放以来,我国经济得到快速发展,取得了举世瞩目的成就,然而,持续增长的工业化、农业现代化、城镇化进程也引发了地质灾害、地下水过度开采及污染、尾矿污染等一系列严重的地质环境问题,不但对人们的生活造成了越来越大的危害,而且也严重影响了我国经济长久发展的前景。因此,合理地利用各种自然和生态资源、对地质环境进行监控和防治、有效地减少和弥补社会经济的发展对地质环境的不利影响,是维持自然生态平衡、促进经济的可持续发展的一项重要工作。为此,我国构建了国家级、省级、地(市)级的叁级地质环境监测与管理部门体系,投入了大量人力、物力,广泛开展地质环境调查工作,全面收集了基础的地质环境数据,建设了完善的地质环境监测网络,实现了对重点对象监测数据的实时采集和传输。随着时间推移,这些地质环境调查数据和监测数据经不断积累已达到了一定的规模,现有的地质环境信息处理系统已经无法有效地对这些数据进行有效的分析和深入的挖掘。主要存在以下问题:(1)上级部门和下级部门、以及平级部门的所用的数据存放平台各异,数据存放很分散且数据格式也不统一,难以实现上下级以及平级部门之间数据的共享;(2)下级部门在形成上报数据的过程中,人工参与比较多,效率不高且容易造成上下级部门之间数据的不一致:(3)地质环境数据量变得越来越庞大,在检索并分析地质环境调查数据以及地质环境监测数据时,大量的查询、连接、聚合运算操作耗时巨大,分析效率低至无法忍受:(4)对地质环境调查及监测数据的分析和评估的手段还不够丰富,没有充分地利用丰富的海量历史数据来对其内部价值进行深入的挖掘,难以找山数据后面隐藏的地质环境演变的规律和模式,也无法评估各类因素对地质环境变化的影响情况。因此,将分散地存放在不同部门的、不一致的海量地质环境调查及监测的历史数据进行抽取、转换后,有机地整合到统一的存储空间,为全方位地分析评估和深入挖掘提供数据源,拓展和发现对地质环境调查及监测数据进行分析评估的新手段,从而最大限度地分析和挖掘出海量数据后面所隐藏的地质环境对象演化演变的规律,为地质环境的评估和治理决策提供更加科学的依据,已经成为新时代地质环境监测及防治信息化建设的首要任务。本文的研究内容源自中国地质环境监测院的地质环境数据仓库建设项目,项目的建设目标是构建集成度更高的、可实现数据融合的地质环境数据仓库,并实现相应的辅助决策应用系统。本文对当前国内外地质环境数据分析和处理手段的现状、我国地质环境管理部门的行政组织结构及业务工作流程、地质环境历史调查和监测数据的分布情况、目前地质环境信息化和数据分析处理工作中存在的不足进行了全面的探讨。在此基础上,提出了一个构建地质环境数据仓库及辅助决策应用系统的完整解决框架。整个框架可对地质环境操作数据库中的数据进行重组,构建地质环境数据仓库及多维数据模型,并实现了数据从操作数据库到数据仓库的清理、转换和加载。同时,还设计和实现了对数据仓库中的数据进行联机分析处理及数据挖掘的算法及模块,为地质灾害预报预警、地下水监测与保护、矿山地质评估、资源承载力评估等各种决策工作提供了支持。本文的主要研究内容有:(1)提出并构建了一个地质环境数据仓库,并实现联机分析处理和数据挖掘功能的完整体系,由此形成了一套地质环境数据集成、分析、挖掘、展示的完整框架。涵盖了从数据的清理、转换和加载,到OLAP多维数据模型的构建及对数据的即时分析处理,再到地质环境数据的深入挖掘等实现数据仓库应用所需的各个环节,有效地提升了地质环境信息的分析和评估的机制,开拓了地质环境管理辅助决策的新途径。(2)在分析现有地质环境数据的分布状态及管理流程的基础上,对地质环境数据进行了整合,设计了地质环境数据仓库的体系结构,并按照“地质灾害监测与治理”、“地下水监测与保护”、“矿山地质环境评估与治理”、“地质遗迹调查与保护”、“地质环境及资源承载力综合评价”等不同的数据集市来组织和存储地质环境历史数据。(3)研究了一套地质环境数据仓库的性能优化方案,综合运用Bitmap索引、分区管理、以及异步CDC增量抽取策略等多种手段,有效地提高了地质环境数据仓库的检索、分析效率。(4)研究构建地质环境多维分析体系的方法,设计、实现多种地质环境多维数据立方,并提供前端系统来实现灵活的联机分析处理。(5)研究基于地质环境数据仓库的数据挖掘模型,深入发现海量地质环境数据下隐藏的规律和模式,设计基于支持向量机的地质灾害时间序列预测、基于神经网络的地下水水质评价、基于综合指数分析法的矿山地质环境评估,基于综合指数分析法的自然资源环境承载力评估等数据挖掘算法。(6)研究、设计了多平台联机分析处理和数据挖掘前端系统的方案,实现了通过Web浏览器、智能手机、平板电脑都可访问地质环境数据仓库的灵活的前端系统,为地质环境数据仓库提供丰富的、直观的用户接口。论文的主要特色和创新点有:①提出并构建了集地质环境数据集成、分析、挖掘、展示为一体的地质环境数据仓库体系,系统地变革了地质环境数据分析的机制,提高了决策效率。②设计了综合运用索引、分区、增量抽取等多种策略的地质环境数据仓库性能优化方案,有效提高了数据仓库的运行效率。③为地质环境数据仓库提供了可在多种平台使用的、丰富灵活的前端系统接口,使数据仓库中的数据获得更加多样的使用途径。论文的不足有:①联机分析处理所使用的Mondrian平台虽然有着很好的移植性,但是在内存分配和处理上还存在着一定的缺陷,而且很难对内部实现细节进行调整。②由于研究时间有限,以及许多业务领域的数据还未汇集完整的原因,没有进一步提出更多的许多数据挖掘算法,并在地质环境数据仓库中加以验证和比较。总之,地质环境数据仓库及其联机分析处理和数据挖掘系统的出现,是地质环境数据处理方式的必然变革,也必定会提高地质环境管理和决策的科学性和效率。(本文来源于《中国地质大学》期刊2014-11-01)
吴乔,罗键,林金有[2](2014)在《煤炭企业生产成本联机分析处理和数据挖掘研究》一文中研究指出针对煤炭企业生产成本分析与控制存在准确性低、决策支持不够等问题,提出了一种生产成本管理与决策支持设计方案。该方案采用数据集市采集整个生产范围内的生产成本,并对生产成本进行实时归集和核算,采用联机分析处理和数据挖掘技术获得隐藏在生产成本内部的规律和趋势,从而为决策者提供决策支持。实际应用表明,该方案实现了生产成本的实时分析与控制。(本文来源于《工矿自动化》期刊2014年04期)
陈旭辉,刘东坡,武玉杰[3](2012)在《中间存储的联机分析关联规则挖掘方法》一文中研究指出针对"挖掘不同支持度下的关联规则需要反复扫描多维数据库所带来大量的系统I/O开销"这一缺限,提出一种基于中间存储的联机分析关联规则挖掘OLAM方法.在自行开发的联机分析处理OLAP的基础上,对待分析的多维数据集利用BCTree存储谓词集频度索引数,利用改进的Apriori关联规则挖掘算法分析用户感兴趣的维度,减少挖掘维度的个数,提高了反复挖掘的系统效率和系统针对性.生产数据证明了该方案的正确性和有效性.(本文来源于《厦门理工学院学报》期刊2012年02期)
胡小春[4](2012)在《基于数据仓库的联机分析挖掘技术的研究》一文中研究指出处在信息膨胀的社会环境当中,人们对信息处理分析的要求和关注正在逐渐提高。因此,各种高效的数据分析处理技术便成为目前信息技术领域的研究热点。OLAP技术与DM技术都是数据分析的关键技术,在决策分析过程中两者可以分工合作、功能互补。联机分析处理技术(OLAP)(?)能够根据用户提出的假设进行多维分析,最终得到对假设肯定或者否定的回答,因而它很容易受用户的主观性抑制从而影响分析结果的正确性;而数据挖掘技术(DM)一旦确定了挖掘算法就会立即自动执行,整个挖掘的过程用户无法介入,具有一定的盲目性,如何把两者结合起来,提高数据分析技术的效率与实用性,己经成为目前这一研究领域的焦点问题。因此,J.W.HAN于1997年提出了OLAM这一概念,它结合了二者的优点,实现了在OLAP基础上进行交互式数据挖掘的方法。OLAM挖掘机制的关键在于高效的数据挖掘算法,本论文选择了具有广泛应用的关联规则挖掘算法进行分析研究,并对关联规则中多维多层的关联规则进行了深入研究。本文在研究OLAM体系结构的基础之上,提出了一种基于数据立方体的多维多层挖掘的系统结构。该论文在对关联规则挖掘、OLAP、数据立方体等相关概念研究的基础上,总结分析了现有的基于数据立方体的多维多层关联规则的挖掘算法,并进行了一定的改进:首先,把OLAP的钻取操作引入搜索过程,通过动态调整立方体的维层次,挖掘出用户感兴趣的关联规则;其次,在频繁谓词集的生成过程中,通过散列技术过滤候选频繁谓词集,提高了算法的性能;最后,引入了基于后件的关联规则产生算法来减少冗余规则的出现,提高了规则的兴趣度。在本文的最后,对算法的主体部分进行了实验测试,验证了改进后算法的有效性。(本文来源于《西安工业大学》期刊2012-04-28)
李纳[5](2011)在《社会保障体系中医疗保险的数据挖掘与联机分析研究》一文中研究指出近年来,社会保障工作作为落实科学发展观和构建社会主义和谐社会的重要内容,被给予了普遍的关注,同时也对其提出了更高的要求。在建立健全社会保障体系的基础上,依靠信息化的手段提供技术支持,对各种信息进行科学有效的管理,并根据这些信息进行科学的决策,完善各项社会保障制度。我国社会保障体系建设已经过了十几年的发展,并取得了重要的成果,确立了以社会统筹与个人账户相结合的基本养老保险和基本医疗保险制度,涵盖养老、医疗、失业、工伤和生育保险,覆盖范围还在不断扩大。随着劳动和社会保障体系的不断完善和社保信息系统的长期应用,系统中的数据量越来越庞大,以贵阳市社保局为例,其系统中的数据量早已达到T级。把系统中的数据提取出来做进一步的分析,使大量无序的数据变为科学客观的知识,是社会保障系统信息化管理工作的需求,也是社保工作未来发展的方向。这些隐含在数据里的知识,对于辅助决策过程,提高基金监管水平,提高保障水平,健全管理服务体系等,有着重要的作用和意义。论文以贵阳市医疗保险业务为背景,研究的主要目标是,初步搭建一个基于Oracle的数据仓库平台并在此平台上进行主题数据仓库的构建,包括数据仓库的设计,OLAP前端展示和数据挖掘的研究。本文首先介绍了研究背景及意义、国内外研究现状以及研究目的。结合社保工作的需要对数据仓库技术、OLAP、数据挖掘技术进行了技术概述。通过对上述技术的研究和对社保中医疗保险业务的了解,详细设计了面向医保单病种主题和在职职工医疗基金征收主题的数据仓库,包括设计的目标,总体设计的描述和整体的技术架构。探讨了医保单病种主题和在职职工医疗基金征收主题基于Oracle数据仓库平台的实现,着重的研究了数据仓库模型、OLAP模型和数据挖掘模型的建立;研究分析了O-Cluster聚类算法的特点,及其在ODM中的应用。(本文来源于《贵州财经学院》期刊2011-03-01)
尹婷,王加阳,赵思佳[6](2010)在《基于联机数据挖掘技术的高校招生分析系统的设计与实现》一文中研究指出以高校招生信息平台为研究对象,分析了传统的C/S模式下招生信息数据挖掘的局限性,引入OLAM概念,提出了基于SQL Server 2005的DMX和MSChart实现高校招生数据在线分析处理,并给出具体实现,从而使招生数据分析处理摆脱了只能在客户端进行的限制。(本文来源于《软件导刊》期刊2010年09期)
尹婷[7](2010)在《基于联机分析挖掘技术的高校招生分析系统研究》一文中研究指出高职院校普遍存在录取新生到校率低的现象,这种低到校率不仅影响到高职院校的健康发展,也造成了教育资源的巨大浪费。目前,这些有关招生的知识都是以零碎的、分散的方式存在的,没有形成系统的、集中的知识体系。本文工作将OLAM技术应用到高校招生分析系统,该方法以历年考生录取信息和考生报到信息作为数据来源,采用数据挖掘技术获取招生数据中隐含的影响考生报到的相关知识。在基于OLAM的高校招生系统的实现过程中,主要围绕以下叁个方面进行研究:(1)招生数据融合关键技术的研究,详细分析了历年招生数据和报到数据的结构,采用了SSIS工具将其进行整合,形成了一套整体的数据仓库,为实现OLAM数据分析提供了数据基础。(2)招生要素筛选方法的研究,历年招生录取数据档案含有考生详细资料,利用关联规则算法挖掘融合好的数据仓库,得出其影响新生报到关键要素。(3)数据挖掘算法的研究,分析了数据挖掘中常见挖掘算法的特点和常应用环境,选择采用关联规则算法得其招生要素,后用聚类分析算法得到适用的规则,用来指导招生工作的政策制定。在实际工作中,将本系统挖掘出的知识用于指导湖南环境生物学院的2010年招生工作,结果显示,2010年考生到校率达到93.22%,相对于往年有了13%的增长。(本文来源于《中南大学》期刊2010-09-01)
张立斌,潘伟[8](2010)在《基于位编码的联机分析处理及数据挖掘算法》一文中研究指出联机分析处理系统(OLAP)中的查询问题或决策支持系统中的查询非常复杂,如何处理大维度的海量数据是一个挑战。提出了一种用于OLAP多维数据库及相关数据挖掘的并行体系结构;提出了一种改进的适用于完整或部分数据立方体的并行计算调度优化方法;实现了一个大尺度的多维数据库引擎,适用于在多维度、海量数据的OLAP或SSDB中进行维度分析。(本文来源于《信息技术》期刊2010年08期)
顾牛[9](2010)在《基于数据挖掘的电力企业联机分析处理系统的设计与应用》一文中研究指出随着电网技术的不断发展以及企业信息化的普及,电网运行和变电站信息管理系统每天都会产生大量的数据,这些数据大量的积累,并呈现信息爆炸的趋势,使企业陷入了“数据丰富,而信息匮乏”的尴尬境地。经过接近一年在邹城市供电公司的调查实习工作,逐渐的发现了很多相关的问题,例如,每次变电站发生跳闸事故,都要组织专门的小组对保护及安全监控装置给出的大量的数据进行分析处理,极为耗时,很容易耽误事故处理。便萌生了利用所学的数据挖掘和OLAP的知识,简化人工的劳动量,提高电力企业对于事故的分析处理能力,进而提高电力企业对于紧急事故的应对能力,保障电网的安全运行的想法。本文的主要工作是构建一个基于数据挖掘的电力企业联机分析处理系统,对邹城市供电公司大量的业务逻辑数据按照调整后的CRISP-DM数据挖掘的过程,对数据进行业务理解、数据理解、数据粗粒度处理、按主题需求建模、通过数据ETL建立数据仓库,然后对数据仓库按照主题不同分别构建电网故障分析与预测和电网负载平衡分析的分析模型,并应用OLAP分析工具进行多维分析,发现隐含的、不容易被发现的规律或数据间的关联性。本文主要工作流程是,首先按照数据挖掘的基本原理,通过对邹城市供电公司业务逻辑数据库的现状分析,对系统进行需求分析,确定主题域,通过业务理解和数据理解确定支持决策的数据来源,明确数据仓库的成功标准和关键性能指标,运用Microsoft SQL Server 2005对邹城市供电公司所辖的20个变电站的业务逻辑数据按照其后台机软件平台和数据库管理软件的不同而采取不同的措施,通过对数据进行粗粒度处理,完成构建数据仓库的前期准备。然后按照需求的不同构建相应的星型模型,通过数据‘ETL建立数据仓库,对于电网故障分析与预测和电网负载平衡分析方面的需求,通过划分维度和度量值来建立多维数据分析模型,并通过Microsoft Analysis Services数据库分析组件中的MDX来对数据仓库进行智能的OLAP分析处理。最后给出总结,指出本文的缺点和不足,并对今后的工作提出改进意见。(本文来源于《山东大学》期刊2010-04-10)
张炜,李斌[10](2009)在《基于联机公共查询目录的读者行为挖掘的个性化智能服务系统构建》一文中研究指出针对OPAC系统信息库中积累的大量读者借阅和检索行为数据,利用数据挖掘和智能Agent技术,从系统框架建模、工作流程、功能设计、关键技术方面研究了基于读者行为挖掘的个性化智能服务系统的构建及建立、学习和更新读者兴趣需求模式方法,探讨了个性化智能服务的提供和决策支持,以提升图书馆的综合服务层次。(本文来源于《情报理论与实践》期刊2009年10期)
联机挖掘论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对煤炭企业生产成本分析与控制存在准确性低、决策支持不够等问题,提出了一种生产成本管理与决策支持设计方案。该方案采用数据集市采集整个生产范围内的生产成本,并对生产成本进行实时归集和核算,采用联机分析处理和数据挖掘技术获得隐藏在生产成本内部的规律和趋势,从而为决策者提供决策支持。实际应用表明,该方案实现了生产成本的实时分析与控制。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
联机挖掘论文参考文献
[1].吴湘宁.地质环境数据仓库联机分析处理与数据挖掘研究[D].中国地质大学.2014
[2].吴乔,罗键,林金有.煤炭企业生产成本联机分析处理和数据挖掘研究[J].工矿自动化.2014
[3].陈旭辉,刘东坡,武玉杰.中间存储的联机分析关联规则挖掘方法[J].厦门理工学院学报.2012
[4].胡小春.基于数据仓库的联机分析挖掘技术的研究[D].西安工业大学.2012
[5].李纳.社会保障体系中医疗保险的数据挖掘与联机分析研究[D].贵州财经学院.2011
[6].尹婷,王加阳,赵思佳.基于联机数据挖掘技术的高校招生分析系统的设计与实现[J].软件导刊.2010
[7].尹婷.基于联机分析挖掘技术的高校招生分析系统研究[D].中南大学.2010
[8].张立斌,潘伟.基于位编码的联机分析处理及数据挖掘算法[J].信息技术.2010
[9].顾牛.基于数据挖掘的电力企业联机分析处理系统的设计与应用[D].山东大学.2010
[10].张炜,李斌.基于联机公共查询目录的读者行为挖掘的个性化智能服务系统构建[J].情报理论与实践.2009