导读:本文包含了垃圾邮件论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:垃圾邮件,向量,算法,特征,神经网络,澳大利亚,系统。
垃圾邮件论文文献综述
谢秦,张清华,王国胤[1](2019)在《基于相似度量的自适应叁支垃圾邮件过滤器》一文中研究指出垃圾邮件过滤是信息时代的一个重要研究课题,一封重要邮件被错分会产生不可估量的代价.因此,如何提高过滤器的性能成为垃圾邮件过滤领域中的核心问题.目前,业界通常采用机器学习算法中的二分类模型以处理垃圾邮件过滤问题.然而,较之于叁支决策模型,二分类模型会产生较大的错分代价.作为叁支决策的一个重要分支,基于决策理论粗糙集的叁支决策模型符合人类认知习惯,且能有效地降低错分代价,进而提高过滤器的性能.然而,在构造损失函数时,少有研究考虑由于等价类之间的差异性而对分类结果带来的影响.因此,在基于决策理论粗糙集的叁支决策模型的基础上,提出了一种基于相似度量的自适应叁支垃圾邮件分类模型.该模型根据集合方差计算了条件属性的权重,并基于相似度量建立了一种刻画差异信息的综合评价函数,进而根据贝叶斯决策规则构建了一种计算自适应阈值对的方法.实验结果表明所提模型在垃圾邮件过滤领域表现优异.(本文来源于《计算机研究与发展》期刊2019年11期)
张柳艳[2](2019)在《基于SDA的中文垃圾邮件过滤研究》一文中研究指出随着互联网技术的高速发展,电子邮件以其成本低廉、传输便利的优势在互联网上被广泛使用,逐步成为人们重要的一种交流通信工具。但是在商业利益的驱动下,企业和个人经常通过群发邮件进行营销,使得用户收到的垃圾邮件数量远远超于正常邮件数量。据统计,在2018年全球虚假电子邮件的日发送量估计已高达64亿,过去几年中,企业电子邮件诈骗(BEC诈骗)损失成本已达到120亿美元。由此可见,对反垃圾邮件技术的研究不可或缺。传统垃圾邮件过滤方法在中文垃圾邮件过滤中存在准确率不高、数据特征难以提取的问题,而浅层神经网络模型在垃圾邮件过滤中不能表示复杂的目标函数,训练时容易陷入局部最优。本文提出了基于SDA的中文垃圾邮件过滤方法,首先对深度网络进行无监督逐层预训练,初始化网络参数;然后通过有监督学习对网络参数进行反向微调,获取最优的模型参数;该深度网络模型可以很好的对短文本中文垃圾邮件进行过滤,并针对深度网络在训练时速度慢、模型鲁棒性差、容易受噪音影响以及容易出现过拟合等特点,对模型进行了优化和改进。本文主要的工作如下:(1)本文采用TREC06C数据集,提取其中的11360条短文本中文垃圾邮件数据正文作为样本数据,然后通过训练Word2vec中CBOW模型来获取深度网络分类所需要的词向量,并将自然语言处理中的深度学习模型堆迭式降噪自编码器应用于中文垃圾邮件中;(2)由于深度网络在训练时极容易发生过拟合现象,本文在深度网络中加入Dropout技术来防止网络过拟合,实验表明:网络中添加了Dropout后,结果更加平稳,网络的泛化效果更好;(3)本文采用的W2C_SDA深度网络中文垃圾邮件过滤模型是一个混合的深度网络,它由堆迭式降噪自编码器和Softamx分类器组合而成;为了提高网络的收敛速度和缓解过拟合现象,在Softmax分类器中加入了L2正则化,实验表明:添加了L2正则化后,网络收敛速度加快,准确率提高了0.2%;(4)通过实验获得W2C_SDA模型最优参数,并且在一个数据集上与伯努利贝叶斯过滤模型和KNN过滤模型的分类效果进行对比,实验表明:与贝叶斯过滤模型和KNN过滤模型相比较,该方法在中文垃圾邮件过滤效果更好。(本文来源于《南昌航空大学》期刊2019-06-01)
曾玉生[3](2019)在《船舶通信网络垃圾邮件的检测分析》一文中研究指出垃圾邮件占用大量的船舶通信网络通信资源,而且危及船舶通信网络安全,针对当前船舶通信网络垃圾邮件检测率低,检测时间复杂度高的难题,设计基于数据挖掘的船舶通信网络垃圾邮件检测方法。首先对船舶通信网络垃圾邮件检测原理进行分析,提取船舶通信网络垃圾邮件检测特征,然后采用数据挖掘方法对船舶通信网络垃圾邮件检测特征进行分析,建立船舶通信网络垃圾邮件检测的分类器,最后进行船舶通信网络垃圾邮件检测实证分析,分析结果表明本文方法的船舶通信网络垃圾邮件检测正确率超过了90%,远远高于船舶通信网络垃圾邮件检测的实际要求,降低了船舶通信网络垃圾邮件检测时间复杂度,是一种有效的船舶通信网络垃圾邮件检测手段。(本文来源于《舰船科学技术》期刊2019年10期)
杨善雯[4](2019)在《基于spark的并行贝叶斯垃圾邮件分类系统》一文中研究指出科技化的急速发展带来了生活各方面的便捷,全球的电子化让电子邮件技术有了用武之地。电子邮件摆脱了传统的纸张书写,能更加迅捷的传输信息,所耗费的人力物力也得到了精简,并且十分易于留存不会轻易丢失,已是当下时代最为主流的交流手段之一。电子邮件带来了诸多便利的同时也产生了不少的弊端,大量的垃圾邮件开始妨碍正常生活,电子邮件被不法商贩用于传播病毒、色情、谣言等信息,给用户生活和工作上造成了极大的不便,同时危害到网络的安全。此外,垃圾邮件还会导致通信阻塞等问题,大量的邮件限制了用户计算机的内存空间和计算能力,让计算机的处理速度陷入了瓶颈。在大数据背景下,数据量和特征空间维度快速增长,文本分类算法的并行化显着提高了其运行效率,本文提出基于Spark的并行贝叶斯垃圾邮件分类系统,采用Simhash去重算法和朴素贝叶斯分类器相结合的分类方式,并使用弹性分布式数据集(RDD)模型来并行处理电子邮件,在提升系统分类效果的同时,提高了系统处理海量邮件的能力。本文主要研究工作如下:1.分析和比较了常用的垃圾邮件分类算法,其中,朴素贝叶斯分类算法因其运算速度快,算法简单,分类精度高等优点而得到广泛应用,故确定了朴素贝叶斯分类器作为垃圾邮件分类系统的核心部分。2.采用RDD的编程模型,在朴素贝叶斯分类器的整个训练和分类阶段实现了计算过程的并行化处理,有效提高了邮件分类系统的运行速率。3.单一的分类方式往往只能覆盖某种类型的垃圾邮件,随着邮件数量的增加,这些处理技术在性能上明显不足,将Simhash去重算法应用到系统中,在电子邮件进入核心分类器模块之前,首先使用Simhash算法对其进行过滤,不能判定的邮件再进入朴素贝叶斯分类器进行判定,提高了垃圾邮件分类系统的分类准确率,缩短了系统处理时间。4.通过对垃圾邮件分类系统的实验对比,在Simhash与朴素贝叶斯相结合的分类器中,系统的召回率和准确率都接近94%,远远高于仅采用朴素贝叶斯分类器作为核心模块的系统。同时,相比单机下的邮件分类系统,运用Spark技术实现朴素贝叶斯的并行计算也大大提高了邮件分类系统的运行速度。(本文来源于《重庆师范大学》期刊2019-05-01)
李凯,邵连杰,秦志宇[5](2019)在《反垃圾邮件管理系统的设计与实现》一文中研究指出在信息技术飞速发展的今天,电子邮件作为一种快捷,经济的通信方式得到了普及,但随之而来垃圾邮件问题也愈加严重。邮件中包含的广告、不良信息甚至是病毒,会对用户造成更大的危害。本文通过对当前反垃圾邮件技术的研究,选取关键字过滤、黑白名单过滤与贝叶斯过滤叁种过滤法来实现一个反垃圾邮件管理系统,旨在帮助用户过滤垃圾邮件,获取更好的邮件使用体验。(本文来源于《科技风》期刊2019年08期)
崔超,吕丹,姜淑凤[6](2019)在《贝页斯垃圾邮件分类系统成本参数调整对系统精度的影响》一文中研究指出为降低垃圾邮件系统分类计算的误码率,分析了贝页斯垃圾邮件过滤系统对目标邮件的自动检测过程,从系统过滤质量和用户容错两个方面研究系统成本定义.在不同样本集合及其属性空间内,对于词语还原和间断表的开启与关闭,重点分析成本参数λ,通过调整成本参数分析贝页斯过滤系统在多种假定下邮件处理结果,完善系统建模定义标准,优化应用系统建模,提高系统过滤质量.实验结果证明该解决方案是可行的.(本文来源于《北京理工大学学报》期刊2019年02期)
[7](2019)在《黑客利用澳大利亚预警网络发送垃圾邮件警报》一文中研究指出据外媒报道,近日一名黑客未经授权进入澳大利亚Aeeris公司EWN预警网络(该网络允许澳大利亚议会或地方政府就极端天气、火灾、疏散信息或事故反应发出紧急警报),并利用该网络通过短信和(本文来源于《保密科学技术》期刊2019年01期)
钟福连[8](2018)在《基于BPNN的AdaBoost垃圾邮件过滤算法研究》一文中研究指出垃圾邮件泛滥成灾,影响了网络的正常运行及人们的生活质量。文中以BPNN作为弱分类器,使用Ada Boost算法,将多个BPNN弱分类器组成一强分类器BPNN_AdaBoost。结果显示,BPNN_AdaBoost模型的准确率优于BPNN模型。该实验证明强分类器分类的准确率明显高于弱分类器的准确率6%以上,其中误判率与漏判率皆降低,表明BPNN_AdaBoost分类模型取得良好的效果。(本文来源于《长沙民政职业技术学院学报》期刊2018年04期)
刘浩然,丁攀,郭长江,常金凤,崔静闯[9](2018)在《基于贝叶斯算法的中文垃圾邮件过滤系统研究》一文中研究指出目前大部分中文垃圾邮件过滤系统受文本稀疏及模型特征局限的影响较大,其特征高维和特征局限的缺陷成为制约过滤效果的重要因素。针对特征高维问题,提出一种基于中心词扩展的TF-IDF(term frequency-inverse document frequency)特征提取算法,增加了特征节点的表达能力,实现了特征降维。针对分类模型特征局限和属性间条件独立性假设不成立问题,提出一种基于GWO_GA(grey wolf optimizer-genetic algorithm)结构学习算法的3层贝叶斯网络模型,放松了条件独立性假设,增加了特征多样性,最终形成基于中心词扩展的TF-IDF特征提取及GWO_GA结构学习的3层贝叶斯算法。通过大量中文邮件数据验证,算法可明显提高中文垃圾邮件过滤效果。(本文来源于《通信学报》期刊2018年12期)
李玉峰,米晓琴,杨婷[10](2019)在《Windows下SpamAssassin对中文垃圾邮件的过滤研究》一文中研究指出英文垃圾邮件过滤效果良好的开源软件Spam Assassin,在Windows下的应用研究较少。在Windows下安装配置Spa-m Assassin,针对中文邮件添加规则与学习贝叶斯库,基于真实邮件测试,取得了良好过滤效果。(本文来源于《内蒙古农业大学学报(自然科学版)》期刊2019年01期)
垃圾邮件论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着互联网技术的高速发展,电子邮件以其成本低廉、传输便利的优势在互联网上被广泛使用,逐步成为人们重要的一种交流通信工具。但是在商业利益的驱动下,企业和个人经常通过群发邮件进行营销,使得用户收到的垃圾邮件数量远远超于正常邮件数量。据统计,在2018年全球虚假电子邮件的日发送量估计已高达64亿,过去几年中,企业电子邮件诈骗(BEC诈骗)损失成本已达到120亿美元。由此可见,对反垃圾邮件技术的研究不可或缺。传统垃圾邮件过滤方法在中文垃圾邮件过滤中存在准确率不高、数据特征难以提取的问题,而浅层神经网络模型在垃圾邮件过滤中不能表示复杂的目标函数,训练时容易陷入局部最优。本文提出了基于SDA的中文垃圾邮件过滤方法,首先对深度网络进行无监督逐层预训练,初始化网络参数;然后通过有监督学习对网络参数进行反向微调,获取最优的模型参数;该深度网络模型可以很好的对短文本中文垃圾邮件进行过滤,并针对深度网络在训练时速度慢、模型鲁棒性差、容易受噪音影响以及容易出现过拟合等特点,对模型进行了优化和改进。本文主要的工作如下:(1)本文采用TREC06C数据集,提取其中的11360条短文本中文垃圾邮件数据正文作为样本数据,然后通过训练Word2vec中CBOW模型来获取深度网络分类所需要的词向量,并将自然语言处理中的深度学习模型堆迭式降噪自编码器应用于中文垃圾邮件中;(2)由于深度网络在训练时极容易发生过拟合现象,本文在深度网络中加入Dropout技术来防止网络过拟合,实验表明:网络中添加了Dropout后,结果更加平稳,网络的泛化效果更好;(3)本文采用的W2C_SDA深度网络中文垃圾邮件过滤模型是一个混合的深度网络,它由堆迭式降噪自编码器和Softamx分类器组合而成;为了提高网络的收敛速度和缓解过拟合现象,在Softmax分类器中加入了L2正则化,实验表明:添加了L2正则化后,网络收敛速度加快,准确率提高了0.2%;(4)通过实验获得W2C_SDA模型最优参数,并且在一个数据集上与伯努利贝叶斯过滤模型和KNN过滤模型的分类效果进行对比,实验表明:与贝叶斯过滤模型和KNN过滤模型相比较,该方法在中文垃圾邮件过滤效果更好。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
垃圾邮件论文参考文献
[1].谢秦,张清华,王国胤.基于相似度量的自适应叁支垃圾邮件过滤器[J].计算机研究与发展.2019
[2].张柳艳.基于SDA的中文垃圾邮件过滤研究[D].南昌航空大学.2019
[3].曾玉生.船舶通信网络垃圾邮件的检测分析[J].舰船科学技术.2019
[4].杨善雯.基于spark的并行贝叶斯垃圾邮件分类系统[D].重庆师范大学.2019
[5].李凯,邵连杰,秦志宇.反垃圾邮件管理系统的设计与实现[J].科技风.2019
[6].崔超,吕丹,姜淑凤.贝页斯垃圾邮件分类系统成本参数调整对系统精度的影响[J].北京理工大学学报.2019
[7]..黑客利用澳大利亚预警网络发送垃圾邮件警报[J].保密科学技术.2019
[8].钟福连.基于BPNN的AdaBoost垃圾邮件过滤算法研究[J].长沙民政职业技术学院学报.2018
[9].刘浩然,丁攀,郭长江,常金凤,崔静闯.基于贝叶斯算法的中文垃圾邮件过滤系统研究[J].通信学报.2018
[10].李玉峰,米晓琴,杨婷.Windows下SpamAssassin对中文垃圾邮件的过滤研究[J].内蒙古农业大学学报(自然科学版).2019