基于差异度量和互信息的文本特征选择算法

基于差异度量和互信息的文本特征选择算法

论文摘要

针对基于文档频率的特征选择算法易于忽略词频和类别关系的问题,提出一种基于差异度量和互信息的文本特征选择算法。融合归一化差异度量和互信息概念,引入词频信息和特征分布系数,弥补归一化差异度量算法在特征选择过程中忽略词频和特征词与类别之间关系的不足,并增加特征分布系数对其进一步优化。实验结果表明,在不同特征维度下,该算法能够有效提高文本分类准确率。

论文目录

  • 1 基本原理
  •   1.1 归一化差异度量
  •   1.2 互信息
  • 2 文本特征提取算法的改进
  • 3 实验结果与分析
  •   3.1 实验环境与语料库
  •   3.2 实验结果与分析
  • 4 结语
  • 文章来源

    类型: 期刊论文

    作者: 潘晓英,陈柳,王昊,赵逸喆,孙俊

    关键词: 归一化差异度量,互信息,特征选择,词频信息,特征分布

    来源: 西安邮电大学学报 2019年06期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用

    单位: 西安邮电大学计算机学院,西安邮电大学陕西省网络数据分析与智能处理重点实验室

    基金: 国家自然科学基金资助项目(61702414)

    分类号: TP391.1

    DOI: 10.13682/j.issn.2095-6533.2019.06.010

    页码: 53-56

    总页数: 4

    文件大小: 282K

    下载量: 41

    相关论文文献

    • [1].基于指数损失间隔的多标记特征选择算法[J]. 计算机技术与发展 2020(04)
    • [2].基于?_(2,1)范数的在线流特征选择算法[J]. 计算机与数字工程 2019(06)
    • [3].森林优化特征选择算法的增强与扩展[J]. 软件学报 2020(05)
    • [4].基于自步学习的半监督特征选择算法研究[J]. 电脑知识与技术 2020(15)
    • [5].基于图的特征选择算法综述[J]. 安徽大学学报(自然科学版) 2017(01)
    • [6].面向高维微阵列数据的集成特征选择算法[J]. 计算机工程与科学 2016(07)
    • [7].基于支持向量机的特征选择算法综述[J]. 信息工程大学学报 2014(01)
    • [8].一种改进的文本分类特征选择算法[J]. 微电子学与计算机 2011(12)
    • [9].基于邻域交互增益信息的多标记流特征选择算法[J]. 南京大学学报(自然科学) 2020(01)
    • [10].大数据中基于稀疏投影的在线特征选择算法[J]. 湖南科技大学学报(自然科学版) 2018(03)
    • [11].一种改进的动态流特征选择算法[J]. 计算机工程与应用 2012(18)
    • [12].特征选择算法研究综述[J]. 安徽广播电视大学学报 2019(04)
    • [13].一种改进的类别区分词特征选择算法[J]. 计算机与现代化 2019(03)
    • [14].特征选择算法及应用综述[J]. 办公自动化 2018(21)
    • [15].多标记特征选择算法的综述[J]. 郑州大学学报(理学版) 2020(04)
    • [16].海量高维数据下分布式特征选择算法的研究与应用[J]. 科技通报 2013(08)
    • [17].全局调距和声特征选择算法[J]. 计算机工程与应用 2019(02)
    • [18].基于标记权重的多标记特征选择算法[J]. 计算机科学 2017(10)
    • [19].多标记不完备数据的特征选择算法[J]. 计算机科学与探索 2019(10)
    • [20].一种基于支持向量数据描述的特征选择算法[J]. 智能系统学报 2015(02)
    • [21].基于XGBoost的特征选择算法[J]. 通信学报 2019(10)
    • [22].用于轴承表面缺陷分类的特征选择算法[J]. 轴承 2018(01)
    • [23].基于森林优化特征选择算法的改进研究[J]. 软件学报 2018(09)
    • [24].面向代价敏感的多标记不完备数据特征选择算法[J]. 小型微型计算机系统 2018(12)
    • [25].基于多视角学习和注意力的特征选择算法[J]. 北京交通大学学报 2020(05)
    • [26].一种基于谱理论的并行特征选择算法[J]. 计算机应用与软件 2010(11)
    • [27].改进的特征选择算法[J]. 计算机工程与设计 2008(22)
    • [28].基于分割策略的特征选择算法[J]. 计算机科学 2018(10)
    • [29].基于拉普拉斯评分的多标记特征选择算法[J]. 计算机应用 2018(11)
    • [30].基于特征关联的多标记谱特征选择算法[J]. 闽南师范大学学报(自然科学版) 2017(02)

    标签:;  ;  ;  ;  ;  

    基于差异度量和互信息的文本特征选择算法
    下载Doc文档

    猜你喜欢