基于word2vec和XGBoost相结合的国网95598客服投诉工单分类

基于word2vec和XGBoost相结合的国网95598客服投诉工单分类

论文摘要

为了解决95598客服投诉工单的整理、归档等问题,其中包括:在人工进行归档的过程中出现的疏忽造成的归档随意问题,即归档准确性问题;人工对投诉工单进行差错点归纳的耗时问题,即效率问题;人工对客服投诉分析深度不足,无法精准快速定位用户诉求热点的问题,即深度问题。本文针对以上三个问题给出解决方案,采用word2vec和XGBoost相结合的方式达到对95598客服投诉工单精准归纳。在文本词向量化的过程中采用word2vec方法,得到单词的文本词向量;利用XGBoost算法对95598客服投诉工单进行分类归档,并且对历史投诉工单的责任部门、专业分类、诉求事件、差错点四个方面进行标注。该模型的分类准确率在83%-91%左右,有较好的的效果。基于工单分类的结果,并设计了相关的投诉类看板,更直观的对数据进行展示。

论文目录

  • 1 算法简介
  • 2 工单分类流程
  •   2.1 梳理分类知识图谱并标注历史投诉工单
  •     2.1.1 分类知识图谱概述
  •     2.1.2 分类知识图谱梳理
  •     2.1.3 样本分类标注
  •   2.2 利用正则表达式清洗文本
  •     2.2.1 去除标点符号
  •     2.2.2 停用词、稀缺词去除
  •     2.2.3 消歧转换
  •     2.2.4 个性化文本转化
  •     2.2.5 习惯用语去除
  •   2.3 构造专业词库提升分词准确度
  •     2.3.1 分词概述
  •     2.3.2 构造专业词库提升分词准确率
  •   2.4 文本词向量化以及分类模型
  • 3 实例结果
  •   3.1 模型分类结果
  •   3.2 业务应用
  •     3.2.1 投诉热点分析
  •     3.2.2 利用时间序列预测未来投诉趋势
  • 4 结语
  • 文章来源

    类型: 期刊论文

    作者: 段立,徐鸿宇,王懿,赵莉,刘冲,郭娇

    关键词: 投诉工单,词向量,极端梯度提升,工单分类,投诉看板

    来源: 电力大数据 2019年12期

    年度: 2019

    分类: 工程科技Ⅱ辑,信息科技,经济与管理科学

    专业: 电力工业,计算机软件及计算机应用,工业经济,企业经济

    单位: 重庆国家电网客户服中心

    分类号: F426.61;F274;TP391.1

    DOI: 10.19317/j.cnki.1008-083x.2019.12.008

    页码: 50-57

    总页数: 8

    文件大小: 3214K

    下载量: 214

    相关论文文献

    标签:;  ;  ;  ;  ;  

    基于word2vec和XGBoost相结合的国网95598客服投诉工单分类
    下载Doc文档

    猜你喜欢