论文摘要
网络入侵检测已经广泛运用机器学习模型,但是研究者们多关注模型选择和参数优化,很少考虑数据不平衡的影响,往往会导致少数类入侵样本的检测效果较差.针对该问题,以SMOTE(synthetic minority oversampling technique)数据再平衡算法为研究重点,应用入侵检测数据集KDD99作为原始训练集,使用简单抽样和SMOTE算法生成再平衡训练集.采用多种机器学习模型分别在原始训练集和再平衡训练集进行5折交叉验证.实验结果表明,与原始训练集相比,使用再平衡训练集建模能够在不降低甚至提高多数类样本识别效果前提下,使少数类样本的识别准确率和召回率增强10%~20%.因此,SMOTE算法对不平衡样本下的网络入侵检测有显著的提升作用.
论文目录
文章来源
类型: 期刊论文
作者: 张阳,张涛,陈锦,王禹,邹琪
关键词: 网络入侵检测,算法,机器学习,数据再平衡
来源: 北京理工大学学报 2019年12期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 互联网技术,自动化技术
单位: 中国信息安全测评中心
分类号: TP393.08;TP181
DOI: 10.15918/j.tbit1001-0645.2018.423
页码: 1258-1262
总页数: 5
文件大小: 127K
下载量: 341