基于统计的分类算法及其在潜在客户识别中的应用研究

基于统计的分类算法及其在潜在客户识别中的应用研究

李畅[1]2004年在《基于统计的分类算法及其在潜在客户识别中的应用研究》文中认为随着数据库技术的成熟和数据应用的普及,以数值形式存在的数据正以指数速度迅速增长。人们不再满足于对这些数据进行简单的事务管理和信息检索,而期望从数据中获取知识来辅助决策。这种需求,使数据挖掘成为近年来计算机领域研究的热点之一。而经过十多年的研究,数据挖掘技术已较为成熟,因此近年来研究的重点转为挖掘技术的应用,商务作为数据挖掘的主要应用领域,对知识的需求尤为显着。面对巨大的市场压力,竞争状态主要表现为企业间对最有利客户的激烈争夺上。因此潜在客户识别的研究具有重要的现实意义。 本文首先介绍了潜在客户识别和分类算法概念。在此基础上,分析了潜在客户识别中存在的问题。针对条件属性取值和特定客户类别间的关联,本文在深入研究基于数理统计的算法基础上,提出一种具有统计的确定性因子算法。该算法首先根据条件属性将论域数据划分成等价类,然后计算各等价类中特定类别数据元个数与该等价类数据元总数的比值,得到确定性因子,并将其正态标准化后,作为条件属性的相关度量。实验结果表明,该算法能有效地解决知识的不确定性问题。针对属性选择的问题,本文在分析现有属性选择算法的基础上,提出一种基于推理思想的两层选择算法。该算法首先采用条件属性和类标识属性间的相关度量来判断两者的相关程度,去除与类标识属性无关或负相关的条件属性,减小了后续的学习规模,从而减少了时间开销;在属性选择中引入反馈原理,提出基于改善的属性选择模型,有效的抑制了人为给定阈值所致的选择的属性子集不是最优解或较优解问题,算法在节省时间的同时提高了属性选择的准确率,从而提高了模型精度。实验结果验证了这一结论。本文还针对相关条件属性综合要素对分类的影响,提出了一种构造变量的算法。该方法通过加入自变量来表征相关条件属性的综合要素与数据特定类别的关联,即通过模型对相关条件属性的综合要素的反映,减小了模型误差,提高了模型精度。本文在原有统计算法的基础上,结合上述改进,最后实现了基于统计和粗糙集的潜在客户识别系统原型。

胡雪婷[2]2018年在《电信客户交往圈在客户识别中的研究》文中进行了进一步梳理客户识别是电信客户关系管理领域中一项重要的研究课题,主要研究任务是从大量的客户群体中识别出不同的客户类别。电信客户之间通过通信行为相互建立联系,形成了电信客户的通信网络,从网络结构特征的角度进行研究能够更加全面的了解客户通信习惯。本文从电信客户交往圈的角度,对客户识别进行研究。本文主要内容如下:(1)研究了社会网络分析方法和社团划分算法,首先利用电信客户通话数据来构建电信客户通话网络,并从社会网络分析的角度分析了该网络的结构特性,然后借助快速Newman算法对该网络进行划分,将客户划分为不同的客户群体得到有效的客户交往圈,最后,分析了各客户群体的通话特征。(2)针对目前单属性识别算法的局限性以及现有多属性识别算法中属性选取的主观性和识别结果不够准确的问题,给出了一种基于多目标优化算法的识别算法。该算法首先使用多目标优化算法NSGA-Ⅱ结合Borgatti提出的KPP-Neg和KPP-Pos问题作为目标函数,识别网络中的核心节点,然后对得到的核心节点集再次进行评价选取得分较高的节点集,并和其它识别指标得到的节点集进行比较分析。(3)通过市场收集客户反映数据,得到客户特征属性集。对该属性集进行约简,选取有效特征属性,并借助C4.5算法在潜在客户名单中构造决策树分类预测模型,提取潜在客户的特征属性,从而筛选出有效的异网潜在客户。以某市联通公司提供的通话详单作为实验数据构造电信客户通话网络,对本文客户识别算法进行验证。实验结果表明本文算法能够有效的识别出电信通话网络上的核心客户和异网潜在客户,为运营商实施客户关系管理提供了可靠的信息支持。

吴锐侠[3]2009年在《网络环境下的客户领袖声音发现与识别方法研究》文中研究表明因特网为企业与顾客接触与交互提供了机会和新的平台。在因特网上,企业可以与客户直接地进行交互式沟通,快速准确地了解消费者的需要和欲望,并不断提供合适的产品去满足消费者的需求。因特网具有开放性、匿名性和便捷性特点,人们更愿意在网上主动地诉求自己的所思所想、所需所求。因此,网上汇聚着大量客户信息,这些信息通过网络共享后相互影响。其中,在这些信息中有一种被称之为“领袖意见”的客户声音影响力最大,容易引起其他网民的共鸣和追捧,对企业的网络营销活动和网络营销决策产生重要的影响。因特网是一个信号放大器和传播器。网上的客户领袖声音信息不断地被复制、粘贴和转载,为信息的快速扩散和放大创造了条件,使得客户声音很容易形成影响力更大、持续时间更长的网络口碑,对消费者的购买行为和购买决策、客户满意和品牌忠诚产生极其重要的影响。可见,网络客户领袖声音是网络口碑形成与发展的引擎。在网上,正向的客户领袖声音及其口碑效应能使一个名不见经传的企业在一夜成名,而负面的客户领袖声音及其口碑却可能使一个企业顷刻之间名声扫地,甚至破产。因此,研究发现、识别、引导网络客户领袖声音的方法对企业实施网络营销具有重要的理论意义和实用价值。本文研究网络环境下的客户领袖声音的发现、类型识别方法及其引导策略。首先,在对国内外研究网络客户声音理论及其应用现状文献综述的基础上,构建网络客户声音发现与识别模型;通过构建代理软件侦听机制,检测在线客户日志数据,对侦听出的客户声音多重属性表征数据进行有效融合,准确完整地描述客户声音数据;其次,运用基于距离的多指标离散和综合的统计方法,在客户声音侦听过程中自动锁定、跟踪检测和实时甄别其中的客户领袖声音;最后,运用客户价值取向动机形成理论,对客户领袖声音进行类型划分,通过建立两阶段多特征识别分类模型,对侦听代理软件观测到的客户声音特征属性数据,运用D-S证据推理方法识别特定类型的客户领袖声音,继而给出针对该类声音对应的引导策略,使之有利于企业营销活动和营销决策。最后,运用实证分析方法,选择了具有代表性的网络社区环境进行客户声音发现、识别和引导研究,揭示了客户领袖声音类型识别与发现的整个过程。本文选题自导师“网络环境下客户声音聆听方法及其应用研究”课题中的子问题,受国家自然科学基金重点项目(70631003)的支持。

张文宇[4]2003年在《基于数据挖掘的智能决策研究》文中研究指明当今科学技术的飞速发展,使得数据库的规模日益扩大,存储的数据量急剧增加。因而,迫切需要有新的、更为有效的技术和工具对各种数据信息资源进行开采以发挥其应用潜能。知识发现和数据挖掘技术正是在这样的应用需求背景下产生并随着决策系统的推动而发展的。本文从系统工程进行决策分析的角度出发,借助数据挖掘技术中粗糙集的基本理论,在智能决策框架的指导下,研究了基于数据挖掘的智能决策理论及方法。主要理论包括:①如何利用粗糙集对典型的决策系统即相容性决策系统和不相容性决策系统运用不同的数据挖掘方法进行有效的数据约减和规则提取;②在增量动态的数据库环境下讨论了在典型决策系统中对原始数据和增量数据进行数据约减的方法;③分析了带有优先权属性的粗糙集数据挖掘方法;④以基本粗糙集为基础探讨了粗糙集扩展模型的数据分析方法;⑤研究了粗糙集数据预处理方法。主要研究工作及创新如下: 1.将决策系统分为相容性和不相容性决策系统,针对不同系统的特点提出不同的挖掘模型。 对相容性决策系统从两个角度作为启发式信息对条件属性进行数据约减。第一种方法利用了知识的不可分辨性,并以逻辑推演的方式对决策表进行数据浓缩;第二种方法利用了知识的粒度,并以概念的提升方式对决策表进行数据浓缩。在不相容决策系统中提出了两种改进算法即决策概念包含法和粗糙重复组法对不相容的决策系统挖掘出具有一定可信度的分类规则。 2.在增量式动态数据库中,提出了相容性和不相容性决策系统的数据挖掘模型。 在相容性决策系统中,利用决策矩阵提出改进的处理多元决策属性值的数据挖掘模型,可方便地对增量的数据进行直接处理就可得到基于全局数据集合的分类规则,并对可能性规则的可信度进行了初步探讨;在不相容性决策系统中,利用GDT表与RS概念的结合,提出利用叁个参数即归纳强度、噪声、隶属度判别指标确定分类规则的强度,通过属性的概念归纳,在一定的概率条件下产生分类规则,并能有效地处理增量式的数据。 3.针对条件属性的等价关系和优先二元关系特性,提出了改进的带有优先权属性的粗糙集数据挖掘模型。 论文在粗糙集拓广理论的基础上,利用属性的有序特性即优先二元关系,提出有序属性的数据挖掘改进算法,使基本粗糙集和带有准则的粗糙集在挖掘分类精度上达到统一,且挖掘出的规则简练、更具合理性和综合性。 4.建立了粗糙集与概率统计和模糊理论的拓展模型。 利用数据的统计特征,将概率测度与分类规则结合起来,提出了相应的知识西北工业大学博士学位论文约减算法;利用模糊属性集合的特点,把粗糙集合与模糊集合有机结合起来,将粗糙集中分辨矩阵的思想引入到具有隶属度属性的隐式决策系统中进行数据约减。 5.利用数据的分布特征,提出了一种改进的领域独立的数据预处理模型。 该模型利用xZ统计值测度进行属性离散化,并提出了对条件属性值的分段间隔首先进行初始化分段算法,使其之后的归并工作大大减少,并以不一致性水平阂值作为停机条件,提高了离散化速度。 6.将本文理论部分提出的数据挖掘核心模型应用到电信CRM的客户挖掘中。 将本文提出的数据挖掘核心模型应用于电信CRM的客户挖掘中,主要对电信CRM中的客户行为进行了分组,提出了大客户识别和划分的依据,初步验证了论文相关方法的正确性和有效性。

董宪[5]2006年在《数据挖掘技术在CRM中的应用研究》文中进行了进一步梳理客户关系管理的核心是“以客户为中心”,在客户信息中发现积极的客户关系的过程。数据挖掘技术在客户关系管理(Customer Relations Management,CRM)中的应用是近年来研究的焦点。数据挖掘是从大量数据中挖掘出有用知识的强有力的工具。在CRM中有效运用数据挖掘技术,从与客户有关的大量数据中,挖掘出对企业有价值的知识和规则,能够使企业更好地了解客户,为企业以后的发展决策提供信息支持。 本论文首先介绍了数据挖掘的功能与技术、CRM系统的应用和特征,对数据挖掘技术在CRM中的应用进行了详细的分析。然后,重点对聚类分析算法进行了研究。根据CRM系统中客户数据的特点,为了达到更好的聚类效果,避免由于孤立点数据造成聚类结果局部最优化,本文提出利用模拟退火原理来改进传统k-均值聚类分析算法。将改进算法应用到客户群体分类中,并对应用结果进行分析。 在CRM系统中对客户信息进行分析时,受到许多因素的影响。各个因素间相互制约,相互干扰,无法定量描述。为此,利用层次分析法,将各个因素分成不同的层次,使各个因素定量化。各因素间相比较可以得出因素的权值大小,由此得出的客户信息也更加准确直观。 最后,根据联通公司当前的状况,对联通UNI-CRM系统进行了介绍和分析。利用客户数据,建立数据挖掘模型,使用改进后的k-均值聚类算法进行客户消费结构分类。从分类结果看,客户分类结果更加准确。使用层次分析法对客户忠诚度、客户信用度和客户满意度进行分析,用各个因素的标准化值和对应权值进行加权平均,计算出客户的信息分析结果,使度量结果更加合理、明确。

窦荣兴[6]2005年在《商业银行大客户管理运作机理与创新研究》文中认为大客户特指客户中5%的顶级客户,是产业市场上卖方认为具有战略意义的客户。商业银行大客户管理(Key Customers Management, KCM)是通过持续地为大客户定制产品或服务,满足客户的特定需要,从而培养忠诚度的一种战略性的管理方法。本论文对银行潜在大客户的识别与分类、客户经理团队对大客户的维护、商业银行大客户的退出时机选择等大客户管理密切相关的核心问题进行了深入研究,探讨了潜在大客户的识别与分类的基本方法,设计了大客户经理团队管理的基本模型,构建了大客户适时退出的运行机制。本文的主要内容为:1)提出了潜在大客户的识别和分类营销方案本文应用关联分析、序列分析、聚类分析等数据挖掘方法,探讨商业银行从海量银行信息中发掘潜在客户的具体方法,提出商业银行潜在大客户识别的基本模式,并研究了商业银行潜在大客户识别需要注意的五个要件,进而给出了运用KCM 进行有效管理和大客户营销的对策。国内外学者多探讨应用数据挖掘技术对客户行为模式进行识别,但还没有重视商业银行潜在大客户的识别及其营销的研究。本文的探索为商业银行发掘优质新客户资源,并为之量身定做有效的营销方案提供理论支持和实务借鉴。2)设计了大客户经理团队管理模型针对当前大客户经理营销中存在的大客户流失问题,本文构建了基于团队管理模式下的客户经理激励模型,给出模型相关性质的理论推导,并加以实证检验。结论表明,新的管理模式较传统模式更为有效。现有文献针对银行客户经理方面的探讨,多局限于定性的描述和政策的建议,没有将客户经理流动带来的商业银行经营风险统一起来。论文首次提出了基于团队管理模式的大客户经理激励体系,通过以团队的管理代替单个客户经理与大客户之间的关联,有效减少因客户经理的变动而造成银行客户资源的流失。3)提出了大客户的适时退出机制论文论述商业银行对于大客户理解的叁个误区,并运用客户生命周期理论,总结处于衰退期的企业特性,为商业银行选择退出时机提供依据。文章应用案例分析的方法,针对中海油事件给商业银行带来的风险进行了讨论,并提出了规避大客户风险的四个手段。学界和业界普遍认为大客户能够带来巨大利润,

周玉婵[7]2013年在《数据挖掘在烟草企业CRM中的应用》文中进行了进一步梳理近几年,随着社会对控烟的关注度提高,控烟力度不断加大,低焦油卷烟的发展步伐逐步加快,低焦油卷烟销售将是今后烟草销售的主要趋势。而面临着前所未有的国内外竞争压力,作为连结烟草系统与消费者桥梁的零售客户终端,可以说是决定烟草竞争力的关键。因此,如何挖掘具有发展潜力的高价值零售客户,促进卷烟零售客户经营发展向烟草行业发展方向靠拢是当前烟草网建工作的重中之重。从烟草企业的客户服务策略来看,分析型CRM是未来发展的趋势,通过对操作型CRM中的数据进行提取、分析和预测,把大量的数据转换成可靠实用的信息,指导烟草企业在卷烟销售与客户服务等方面合理配置资源,最终实现改进客户关系的目的。烟草商业企业在经营过程中积累了大量的客户订单数据,利用数据挖掘技术对客户订单数据进行分析,将客户进行细分,从而对在低焦油卷烟方面具有较大销售潜力、培育价值高的客户实施个性化服务,使客户发展与企业发展相互促进,实现客户利润与企业效益最大化。本文是基于微软SQL ServerAnalysis Service(SSAS)进行数据挖掘,主要采用基于Web的B/S体系结构,包括数据源、数据仓库、OLAP、应用服务器和客户端。根据烟草营销的实际分析需求,在SQL Server2005中建立基于零售客户卷烟销售为主题的数据仓库,且从源数据库中抽取、转换和导入相关数据到数据仓库中。接着在数据仓库上通过SSAS对分析主题建立对应的多维数据集,用DMX语言实现各种分析需求和数据的钻取、切片、切块,并用微软Reporting services开发基于web的前端数据展现。本文将研究的广州烟草某区域历史销售数据导入到SQL Server数据库中作为挖掘的数据源,并使用SSAS作为数据挖掘平台,构建数据挖掘模型,并采用决策树分类技术进行数据挖掘,实现对卷烟销售趋势的决策分析。并且,通过分析客户的销售数据挖掘卷烟零售客户的销售潜力,并对潜力客户价值进行分级排序,找出培育价值高的潜力客户。

王宏[8]2006年在《基于粗糙集数据挖掘技术的客户价值分析》文中研究表明当今的客户已经成为左右企业发展的一种决定性的力量。菲利普·科特勒指出以客户为中心的企业不仅需要建设产品,更重要的是建设客户。在现实的市场条件下任何企业要想成功,必须以客户需求为出发点,以满足市场或客户的需求为归宿,把客户对企业的信任和忠诚作为企业最重要的资产。国内外的理论和实践都已证明了忠诚的客户能为企业带来稳定而丰厚的利润,一个企业拥有了忠诚的客户群,就拥有了稳定的利润源和竞争优势,拥有了对市场的控制权。一个客户能保持忠诚越久,企业从他那里获得的利益越多。 企业在培养客户忠诚时必须首先明确不同客户对企业具有不同的价值,企业应向最可能盈利的客户推销产品。基于客户差别及企业能力的限制,任何一个企业都不可能为市场上的全体客户服务。为了能与无处不在的竞争者竞争,企业需要确定它能为之最有效服务的细分市场,把目标关注于为企业带来最大利润的客户,提高他们的忠诚度。为了获得客户的忠诚,企业必须为客户提供优异的价值,因为只有价值才能驱动客户忠诚,增进客户的重复购买行为并增加企业利润。 基于以上的思想,借鉴西方管理学研究的成果,本文针对客户价值分析的理论和方法展开讨论,在客户分类时采用基于粗糙集的数据挖掘技术。 企业常用的客户分类方法是基于经验方法和统计方法的简单划分,这些方法虽然曾得到广泛应用并取得良好效果,但却无法满足日益增长的数据量以及日益复杂的分析需求,而基于数据挖掘技术的分类方法,为进行更深入的客户细分提供了新的实现手段。 所谓数据挖掘也称为知识发现,是从大型数据库和数据中提供潜在价值的知识和规则的过程。数据挖掘技术有各种模式,如关联分析、分类和预测及聚类等。各种模式各有侧重,其中有一些已经研究得较为成熟,研究成果也较多,如挖掘关联规则、预测方法和分类模式中的一些其他方法。而分类模式中关于粗集的挖掘技术目前研究的人还不是很多,相应的研究成果也较少。因而基于粗集的数据挖掘技术有很大的研究价值。粗集理论是针对不确定性问题提出的,它的特点是不需要预先给定某些特征或属性的数量描述,而是直接从给定问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域,从而找出该问题的内在规律。

徐志远[9]2016年在《基于数据挖掘方法的电信客户流失分析》文中认为随着数据挖掘技术的不断发展,其应用领域也不断的扩展。近来,数据挖掘逐渐应用于电信行业中的客户分析,基于数据挖掘对客户分析将会给电信运营商带来更大的经济效益。本文针对基于数据挖掘方法的电信客户流失进行研究,论文所做的主要研究工作和创新点包括以下方面:(1)考虑到预测代价与收益值的不等,针对具体的客户流失分析场景,提出了一种新的评估客户流失预测模型的指标(MPSC指标)。相对以往客户流失预测模型评估指标,新指标不是以客户流失预测模型精准性最大化为目标,而是以企业实际利益最大化为目标来选择最优的客户流失预测模型。并且,新指标在描述客户流失场景时,考虑了不同价值客户的重要程度不同,将客户进行了细分。(2)基于上述新指标,提出了一种改进的决策森林分类算法(SDF算法)。相对Bagging、Random Forest、Adboost等传统的组合性算法,新算法的构建过程不仅仅以算法的精准性为指导,还考虑了算法本身代价收益。最终导致了新算法本身的精准度上不是最佳的,但是在新评估指标上是最佳的。(3)针对客户流失问题,本文提出了一种新的客户流失分析系统框架。该系统框架有机地关联了评估指标、预测模型以及模型应用。该系统框架能够从全局角度考虑客户流失问题,以最大化企业经济利益为目标,并且不断优化评估指标和预测模型。这样,以便更好的应用预测模型,最终能够很好的解决客户流失问题。另外,对预测模型输出的客户流失名单进行了一定客户细分,以便更好的指导企业制作挽留策略。

常明山[10]2003年在《面向大规模定制产品规划关键技术的研究》文中认为随着科技的进步,特别是信息技术的发展,世界市场已从传统的相对稳定型市场演变为动态多变型市场,大规模定制由于克服了大批量生产方式的诸多缺陷,成为制造业发展的必然趋势。本文针对现阶段国内外对大规模定制理论及方法的研究集中于以企业为中心的相关单元技术,缺乏对客户产品需求获取方法、管理方法、分析方法的深入研究,没有考虑全行业大规模定制竞争环境下,基于客户主体的产品评价,确定出具体的研究内容和方向。本论文主要进行了以下几方面研究:1.分析了当前制造业面临的挑战和机遇,通过对企业管理理念、生产方式、管理模式的相应变化分析,指出大规模定制是制造业的必然趋势。综述了大规模定制的理论研究和应用现状,分析了企业需求,明确了本论文的研究重点。2.对MC环境下的客户需求获取方法进行了系统探索。综述了数据挖掘及WEB挖掘的研究与应用现状,阐述了基于CRM的客户需求获取方法;在对WEB信息源进行深入分析的基础上,通过与传统市场调查方法的对比分析,提出并系统研究了基于集中式WEB信息源的客户需求信息获取方法,构建了客户需求采集与分析的系统框架和信息组织结构模型,并对基于WEB获取的需求信息可信度进行了系统分析。3.综述了产品需求分析的研究现状和需求,提出了面向MC的产品需求分析系统框架;研究了MC环境下客户群体的聚类分析方法,提出并研究了基于客户特征的产品(族)匹配方法;对群体客户的需求信息抽取和组织进行了深入分析,建立了面向MC的产品需求拓扑结构,研究了需求信息的规范化方法和基于视图配置的需求信息管理方法;提出并研究了定制影响链的分析方法,建立了MC环境下的产品知识管理框架和实施方法。4.在对DFMC进行分析的基础上,提出了基于功能需求模式识别的变异式产品需求分析方法,并对其中关键技术,包括功能需求拓扑结构、功能需求匹配、功能需求模板、产品(族)实例库的建立等进行了深入分析。5.分析了MC环境下价值工程应用的新特点,对传统价值工程理论进行了拓展,提出了拓展的客户价值概念,分析了其驱动因素,建立了适用于MC环境的量化客户价值度量函数模型,提出并深入研究了基于客户价值的产品竞争力分析方法,并将其应用于大规模定制环境下的产品评价。对于MC环境下的客户产品选择进行了分析,建立了基于客户价值和约束分析的产品选择模型。6.对MC环境下的客户满意度研究进行了有益的探索,综述了客户满意度的研究与应用现状,提出了基于客户价值、面向产品族的客户满意度测量模型,构建了指标体系框架,并且全面论述了该模型的实施方法。7.相关理论研究成果结合企业需求进行了实际应用,并取得较好效果。

参考文献:

[1]. 基于统计的分类算法及其在潜在客户识别中的应用研究[D]. 李畅. 湖南大学. 2004

[2]. 电信客户交往圈在客户识别中的研究[D]. 胡雪婷. 西安理工大学. 2018

[3]. 网络环境下的客户领袖声音发现与识别方法研究[D]. 吴锐侠. 合肥工业大学. 2009

[4]. 基于数据挖掘的智能决策研究[D]. 张文宇. 西北工业大学. 2003

[5]. 数据挖掘技术在CRM中的应用研究[D]. 董宪. 山东科技大学. 2006

[6]. 商业银行大客户管理运作机理与创新研究[D]. 窦荣兴. 华中科技大学. 2005

[7]. 数据挖掘在烟草企业CRM中的应用[D]. 周玉婵. 华南理工大学. 2013

[8]. 基于粗糙集数据挖掘技术的客户价值分析[D]. 王宏. 哈尔滨工程大学. 2006

[9]. 基于数据挖掘方法的电信客户流失分析[D]. 徐志远. 北京邮电大学. 2016

[10]. 面向大规模定制产品规划关键技术的研究[D]. 常明山. 天津大学. 2003

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于统计的分类算法及其在潜在客户识别中的应用研究
下载Doc文档

猜你喜欢