Print

基于类别关键词权重的煤矿安全隐患分类方法

论文摘要

大数据时代,各行各业均产生海量信息,面临大量的信息,如何准确而高效地获取数据中的潜在规律和蕴含价值成为企业信息化的重点。为提升煤矿企业对安全监测数据的理解和监控能力,改善隐患排查治理工作水平,本文提出基于类别关键词权重的短文本分类模型,有效缓解了文本分类中特征稀疏的问题。该方法首先基于朴素贝叶斯算法,对不符合规范的非法数据进行筛选,然后构建基于关键词权重的短文本分类模型,利用中文分词技术、卡方检验方法构建关键词库,最后建立得分模型实现对隐患数据的分类。结果表明,该模型能较为准确地对矿业安全隐患数据进行有效的评级分类,进一步地改善隐患排查和治理的针对性和有效性。

论文目录

  • 1 数据来源及特征
  • 2 基于朴素贝叶斯的数据规范方法
  • 3 基于类别关键词权重的短文本分类模型
  •   3.1 关键词库构建
  •   3.2 类别关键词权重
  •     1.整体权重
  •     2.隐患小类权重
  •     3.标准隐患内容权重
  •   3.3 得分模型
  • 4 实验
  •   4.1 数据
  •   4.2 非法数据过滤
  •   4.3 关键词提取及其特征选择
  •   4.4 计算得分权重
  •   4.5 安全隐患分类
  • 5 结语
  • 文章来源

    类型: 期刊论文

    作者: 林川,武乐飞,戴家佳

    关键词: 权重,短文本分类,煤矿安全隐患,朴素贝叶斯

    来源: 贵州大学学报(自然科学版) 2019年06期

    年度: 2019

    分类: 基础科学,工程科技Ⅰ辑,信息科技

    专业: 矿业工程,计算机软件及计算机应用

    单位: 贵州大学计算机科学与技术学院,贵州大学数学与统计学院

    基金: 贵州省科学技术厅科技支撑计划项目资助(黔科合支撑[2016]2009)

    分类号: TD79;TP391.1

    DOI: 10.15958/j.cnki.gdxbzrb.2019.06.11

    页码: 53-57+97

    总页数: 6

    文件大小: 594K

    下载量: 141

    相关论文文献

    本文来源: https://www.lunwen66.cn/article/d14c9fd5a12b630bc5d16c13.html