论文摘要
大数据时代,各行各业均产生海量信息,面临大量的信息,如何准确而高效地获取数据中的潜在规律和蕴含价值成为企业信息化的重点。为提升煤矿企业对安全监测数据的理解和监控能力,改善隐患排查治理工作水平,本文提出基于类别关键词权重的短文本分类模型,有效缓解了文本分类中特征稀疏的问题。该方法首先基于朴素贝叶斯算法,对不符合规范的非法数据进行筛选,然后构建基于关键词权重的短文本分类模型,利用中文分词技术、卡方检验方法构建关键词库,最后建立得分模型实现对隐患数据的分类。结果表明,该模型能较为准确地对矿业安全隐患数据进行有效的评级分类,进一步地改善隐患排查和治理的针对性和有效性。
论文目录
文章来源
类型: 期刊论文
作者: 林川,武乐飞,戴家佳
关键词: 权重,短文本分类,煤矿安全隐患,朴素贝叶斯
来源: 贵州大学学报(自然科学版) 2019年06期
年度: 2019
分类: 基础科学,工程科技Ⅰ辑,信息科技
专业: 矿业工程,计算机软件及计算机应用
单位: 贵州大学计算机科学与技术学院,贵州大学数学与统计学院
基金: 贵州省科学技术厅科技支撑计划项目资助(黔科合支撑[2016]2009)
分类号: TD79;TP391.1
DOI: 10.15958/j.cnki.gdxbzrb.2019.06.11
页码: 53-57+97
总页数: 6
文件大小: 594K
下载量: 141