基于SMOTE和机器学习的网络入侵检测

论文摘要

网络入侵检测已经广泛运用机器学习模型,但是研究者们多关注模型选择和参数优化,很少考虑数据不平衡的影响,往往会导致少数类入侵样本的检测效果较差.针对该问题,以SMOTE(synthetic minority oversampling technique)数据再平衡算法为研究重点,应用入侵检测数据集KDD99作为原始训练集,使用简单抽样和SMOTE算法生成再平衡训练集.采用多种机器学习模型分别在原始训练集和再平衡训练集进行5折交叉验证.实验结果表明,与原始训练集相比,使用再平衡训练集建模能够在不降低甚至提高多数类样本识别效果前提下,使少数类样本的识别准确率和召回率增强10%～20%.因此,SMOTE算法对不平衡样本下的网络入侵检测有显著的提升作用.

论文目录

1 理论基础

1.1 过采样方法

1.1.1 随机过采样方法（ROS）

1.1.2 SMOTE算法

1.1.3 Borderline-SMOTE算法

1.2 欠采样方法

1.2.1 随机欠采样方法

1.2.2 ENN算法

2 数据预处理和评价指标

2.1 数据来源

2.2 数据预处理

2.3 数据的再平衡

2.4 评价指标

3 建模分析

4 结论

文章来源

类型: 期刊论文

作者: 张阳,张涛,陈锦,王禹,邹琪

关键词: 网络入侵检测,算法,机器学习,数据再平衡

来源: 北京理工大学学报 2019年12期

年度: 2019

分类: 工程科技Ⅱ辑,信息科技

专业: 互联网技术,自动化技术

单位: 中国信息安全测评中心

分类号: TP393.08;TP181

DOI: 10.15918/j.tbit1001-0645.2018.423

页码: 1258-1262

总页数: 5

文件大小: 127K

下载量: 341

基于SMOTE和机器学习的网络入侵检测

论文摘要

论文目录

文章来源

相关论文文献