针对电力客户标签对客户的认知不清晰,客服业务大多针对自然人开展,客户标签标记在电话号码上,而传统电力业务主要针对户(户号)开展,客户标签标记在户号上,存在信息无法共享的困难,提出了基于95598业务,利用大数据分析及文本挖掘方法,构建统一身份识别模型,有效识别客户来电号码与户号的对应关系。采用分词技术,有效解析用电地址信息、客户姓名等内容,并计算地址相似度得分、姓名相似度得分,作为对应关系校验以及识别疑似户号的关键因子指标;针对能获取到的对应关系,构建权重划分模型,计算对应关系匹配度得分,根据分值大小,校验对应关系的可靠性;针对找不到户号对应关系的来电号码,基于文本相似度得分构建KNN模型,计算对应关系匹配度得分,依据分值大小,识别疑似户号。
类型: 期刊论文
作者: 杨菁,刘鲲鹏,金鹏
关键词: 统一身份识别,文本挖掘,大数据,模型
来源: 电力大数据 2019年04期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技,经济与管理科学
专业: 电力工业,计算机软件及计算机应用,工业经济
单位: 国网客服中心服务考评部
分类号: F426.61;TP391.1
DOI: 10.19317/j.cnki.1008-083x.2019.04.011
页码: 67-73
总页数: 7
文件大小: 549K
下载量: 134
本文来源: https://www.lunwen66.cn/article/6a839fdc6180963f69177a6b.html