论文摘要利用对某网络公司的客户数据使用K均值聚类方法,针对数据中存在的缺失和变量共线性严重的情况,对数据进行预处理。通过选择出符合分类目的的变量得出可用于聚类的完整数据集。然后...
论文摘要连续变量离散化属于信用评级建模的初始阶段,科学的离散化操作能够提升模型的分类效果和参数的稳定性,便于评级模型的产品呈现.考虑信用评级的误判成本差异,对类别-属性一致性最...
李畅[1]2004年在《基于统计的分类算法及其在潜在客户识别中的应用研究》文中认为随着数据库技术的成熟和数据应用的普及,以数值形式存在的数据正以指数速度迅速增长。人们不再满足于对这些数据进行简单的事务管理和信息检索,而期望从数据中获取知识来辅助决策。这种需求,使数据挖掘成为近年来计算机领域研究的热点...
梁佩佩[1]2004年在《基于聚类分析的客户生命周期价值挖掘研究》文中认为出现于20世纪80年代后期的数据挖掘,目前已成为知识发现领域小的一个研究热点,也是信息产业界的关注焦点。近年来,国内外学术界和企业界,在对数据挖掘技术和软件工具的研究和开发上都取得了一定的成果。聚类分析是数据挖掘领域中的一种重...
徐建锁[1]2004年在《知识管理和文本挖掘的若干问题研究》文中研究表明在当今的知识经济时代,如何更有效地提高企业的知识管理水平,成为了管理学界的一个研究热点。围绕上述问题,本文对知识管理和文本挖掘的若干问题进行了深入研究,主要包括以下几个方面的内容:通过对以往知识链模型和知识成长模式的分析,从多种...
燕颢[1]2003年在《信息融合几种算法的研究》文中研究说明近年来,多传感器信息融合(数据融合)在军事和民用领域都引起了强烈的关注并得到了广泛的应用。目前世界各军事大国竞相开始投入大量人力、物力和财力进行信息融合技术的研究,安排了大量的研究项目,并已取得了大量研究成果。我国也把信息融合作为发展计算机...
吴为英[1]2003年在《基于粗糙集理论的商业数据挖掘》文中进行了进一步梳理本论文在分析商业数据特点的基础上,结合对数据挖掘技术的研究提出了基于粗糙集理论的商业数据挖掘的构想。基于此构想,本文对粗糙集理论进行了系统研究,提出了一种新的基于粗糙集理论的商业数据挖掘系统,并给出了此系统的详细设计与实现过...
张静[1]2007年在《基于粗集理论的数据挖掘方法及应用研究》文中进行了进一步梳理数据挖掘是从存放在信息库的大量数据中挖掘出有用知识的一种新技术。粗糙集理论作为一种处理不完全、不精确及不确定信息的有效方法,因其具有强大的数值分析能力,故在数据挖掘领域大有用武之地。目前基于粗糙集理论的数据挖掘技术已经...