基于相似度量的自适应三支垃圾邮件过滤器

基于相似度量的自适应三支垃圾邮件过滤器

论文摘要

垃圾邮件过滤是信息时代的一个重要研究课题,一封重要邮件被错分会产生不可估量的代价.因此,如何提高过滤器的性能成为垃圾邮件过滤领域中的核心问题.目前,业界通常采用机器学习算法中的二分类模型以处理垃圾邮件过滤问题.然而,较之于三支决策模型,二分类模型会产生较大的错分代价.作为三支决策的一个重要分支,基于决策理论粗糙集的三支决策模型符合人类认知习惯,且能有效地降低错分代价,进而提高过滤器的性能.然而,在构造损失函数时,少有研究考虑由于等价类之间的差异性而对分类结果带来的影响.因此,在基于决策理论粗糙集的三支决策模型的基础上,提出了一种基于相似度量的自适应三支垃圾邮件分类模型.该模型根据集合方差计算了条件属性的权重,并基于相似度量建立了一种刻画差异信息的综合评价函数,进而根据贝叶斯决策规则构建了一种计算自适应阈值对的方法.实验结果表明所提模型在垃圾邮件过滤领域表现优异.

论文目录

  • 1 基础知识
  •   1.1 基本定义
  •   1.2 相关研究
  •     1.2.1 二元NB分类器
  •     1.2.2 3WD-DTRSs模型
  • 2 基于相似度量的三支决策模型
  •   2.1 基于方差的属性权重度量
  •   2.2 基于相似度量的风险度量
  •   2.3 SBA-3WD-SF模型阈值推导
  •   2.4 算法步骤
  • 3 对比实验
  •   3.1 实验指标
  •     3.1.1 准确率
  •     3.1.2 召回率
  •   3.2 数据预处理与参数设置
  •   3.3 实验结果与分析
  • 4 结 语
  • 文章来源

    类型: 期刊论文

    作者: 谢秦,张清华,王国胤

    关键词: 垃圾邮件过滤,决策理论粗糙集,三支决策,相似度量,阈值

    来源: 计算机研究与发展 2019年11期

    年度: 2019

    分类: 信息科技,基础科学

    专业: 数学,自动化技术

    单位: 计算智能重庆市重点实验室(重庆邮电大学)

    基金: 国家自然科学基金项目(61876201,61772096),重庆市研究生科研创新项目(CYS18244)~~

    分类号: TP18;O225

    页码: 2410-2423

    总页数: 14

    文件大小: 1500K

    下载量: 115

    相关论文文献

    • [1].三支决策-基于粗糙集与粒计算研究视角[J]. 智能系统学报 2019(06)
    • [2].多粒度粗糙集近似集的增量方法[J]. 山东大学学报(理学版) 2020(01)
    • [3].《粗糙集理论及其应用》研究生课程教学改革与实践[J]. 闽南师范大学学报(自然科学版) 2020(01)
    • [4].基于粗糙集理论的水利工程现代化管理评价[J]. 黑龙江水利科技 2020(01)
    • [5].基于代数角度的变精度多粒度粗糙集的约简[J]. 咸阳师范学院学报 2020(02)
    • [6].局部广义多粒度粗糙集[J]. 计算机工程与科学 2020(08)
    • [7].可变多粒度粗糙集粒度约简研究[J]. 哈尔滨师范大学自然科学学报 2019(01)
    • [8].基于覆盖粗糙集的超图连通性[J]. 数码设计 2016(02)
    • [9].关系粗糙集的邻域拟阵结构研究[J]. 数码设计 2016(02)
    • [10].基于粒度矩阵的程度多粒度粗糙集粒度约简[J]. 系统工程与电子技术 2016(12)
    • [11].基于最小/最大描述的多粒度覆盖粗糙直觉模糊集模型[J]. 计算机科学 2017(01)
    • [12].优势关系下多粒度粗糙集排序方法及其应用[J]. 计算机工程与应用 2017(01)
    • [13].优势关系多粒度粗糙集中近似集动态更新方法[J]. 中国科学技术大学学报 2017(01)
    • [14].基于加权粒度和优势关系的程度多粒度粗糙集[J]. 山东大学学报(理学版) 2017(03)
    • [15].组合多粒度粗糙集及其在教学评价中的应用[J]. 数码设计 2017(01)
    • [16].基于粗糙集的大学生学习与就业关系分析[J]. 计算机技术与发展 2017(05)
    • [17].粗糙集理论及其应用综述[J]. 物联网技术 2017(06)
    • [18].不完备信息系统中的广义多粒度双相对定量决策粗糙集[J]. 南京大学学报(自然科学) 2017(04)
    • [19].基于可变多粒度概率粗糙集的分类模型[J]. 模式识别与人工智能 2017(08)
    • [20].基于下近似分布粒度熵的变精度悲观多粒度粗糙集粒度约简[J]. 计算机科学 2016(02)
    • [21].可变程度多粒度粗糙集[J]. 小型微型计算机系统 2016(05)
    • [22].粗糙集理论在国内旅游研究中的应用[J]. 旅游纵览(下半月) 2014(14)
    • [23].基于信息量的悲观多粒度粗糙集粒度约简[J]. 南京大学学报(自然科学) 2015(02)
    • [24].粗糙集理论在故障诊断中的应用研究[J]. 科技视界 2015(16)
    • [25].粗糙集理论在输变电工程造价风险评价指标体系优化中的应用[J]. 土木工程与管理学报 2015(04)
    • [26].基于粗糙集理论的多标度层次分析教师教学评价模型[J]. 数学学习与研究 2017(11)
    • [27].基于粗糙集理论和因果图的故障诊断[J]. 重庆师范大学学报(自然科学版) 2020(02)
    • [28].基于粗糙集的高校学生实践能力因素研究[J]. 计算机技术与发展 2020(04)
    • [29].邻域粗糙集属性约简在民族团结进步创建评价中的应用[J]. 信息与电脑(理论版) 2020(12)
    • [30].新型灰狼算法的粗糙集属性约简及应用[J]. 计算机工程与应用 2017(24)

    标签:;  ;  ;  ;  ;  

    基于相似度量的自适应三支垃圾邮件过滤器
    下载Doc文档

    猜你喜欢