一种基于概率主题模型的恶意代码特征提取方法

一种基于概率主题模型的恶意代码特征提取方法

论文摘要

在当前复杂网络环境下,恶意代码通过各种方式快速传播,入侵用户终端设备或网络设备、非法窃取用户隐私数据,对网络和互联网用户造成了严重的安全威胁.传统检测方法难以检测未知恶意代码,而恶意代码变体的多样性和庞大数量也对未知恶意代码检测构成了巨大挑战.提出了一种无监督的恶意代码识别方法,通过分析反汇编PE文件给出汇编指令标准化规则,结合潜在狄立克雷分布(latent Dirichlet allocation, LDA)获得汇编指令中潜在的"文档-主题"、"主题-词"的分布.再以"主题分布"构造恶意样本特征,产生一个全新的恶意代码检测框架.结合"困惑度"和变化的步长给出了最优"主题"数目的快速评价和自动确定方法,解决了LDA模型中主题数目需要预先指定的问题.同时解析了"文档-主题"、"主题-词"聚集结果的语义可解释性,说明了该方法获得的样本特征具有潜在的语义.实验结果表明:与其他方法相比该方法具有相当的或更好的恶意代码鉴别能力,同时能够准确地识别恶意代码的新变体.

论文目录

  • 1 概率主题模型
  •   1.1 模型定义
  •   1.2 模型推导
  • 2 恶意样本特征的提取
  •   2.1 汇编指令的预处理
  •   2.2 检测框架
  • 3 实验与分析
  •   3.1 汇编指令标准化粗糙程度对分类结果的影响
  •   3.2 主题数目的确定
  •   3.3 LDA主题模型的特征描述能力
  •   3.4 与其他方法的比较
  • 4 总 结
  • 文章来源

    类型: 期刊论文

    作者: 刘亚姝,王志海,侯跃然,严寒冰

    关键词: 恶意代码检测,狄立克雷分布,概率主题模型,困惑度

    来源: 计算机研究与发展 2019年11期

    年度: 2019

    分类: 信息科技,基础科学

    专业: 数学,计算机软件及计算机应用

    单位: 北京交通大学计算机与信息技术学院,北京建筑大学电气与信息工程学院,北京邮电大学网络技术研究院,国家计算机网络应急技术处理协调中心

    基金: 国家重点研发计划项目(2018YFB0803604,2018YFB0804704),国家自然科学基金项目(U1736218,61672086)~~

    分类号: O157.5;TP309

    页码: 2339-2348

    总页数: 10

    文件大小: 1250K

    下载量: 139

    相关论文文献

    • [1].利用代码重构改善软件设计[J]. 信息记录材料 2020(09)
    • [2].代码对比与动态规划[J]. 电脑编程技巧与维护 2017(03)
    • [3].什么样的代码才是好代码[J]. 计算机与网络 2017(06)
    • [4].安全通论(14)——病毒式恶意代码的宏观行为分析[J]. 成都信息工程大学学报 2017(01)
    • [5].恶意代码同源判定技术综述[J]. 通信技术 2017(07)
    • [6].基于方法的克隆代码检测[J]. 信息与电脑(理论版) 2017(13)
    • [7].市代码[J]. 山西教育(招考) 2020(03)
    • [8].有关信息代码[J]. 山西教育(招考) 2019(02)
    • [9].关于机场的冷知识[J]. 意林 2019(22)
    • [10].市代码[J]. 山西教育(招考) 2016(08)
    • [11].代码自动生成及代码上下文分析研究综述[J]. 数据通信 2020(02)
    • [12].智能代码补全研究综述[J]. 软件学报 2020(05)
    • [13].基于文本分类技术的恶意代码检测工具应用[J]. 科技经济导刊 2020(27)
    • [14].克隆代码映射的方法与应用[J]. 计算机工程与应用 2017(06)
    • [15].基于增强描述的代码搜索方法[J]. 软件学报 2017(06)
    • [16].银行代码安全审计工作探索与实践[J]. 网络安全技术与应用 2017(08)
    • [17].重视统一信用代码的应用[J]. 浙江经济 2017(19)
    • [18].代码依恋检测与重构研究[J]. 电子科技 2016(11)
    • [19].基于相识度的恶意代码检测[J]. 计算机科学 2015(01)
    • [20].有关信息代码[J]. 山西教育(招考) 2018(03)
    • [21].有关信息代码[J]. 山西教育(招考) 2016(Z1)
    • [22].有关信息代码[J]. 山西教育(招考) 2011(08)
    • [23].基于模糊识别恶意代码检测技术的研究[J]. 微电子学与计算机 2014(06)
    • [24].恶意代码加壳脱壳技术[J]. 辽宁警专学报 2014(05)
    • [25].代码复查的要点探讨[J]. 技术与市场 2013(06)
    • [26].代码规制:构建安全文明网络的必由之路[J]. 保密科学技术 2013(07)
    • [27].消除隔阂,提升效率——MATHWORKS推出基于MATLAB生成HDL代码的产品[J]. 世界电子元器件 2012(05)
    • [28].C~#托管代码调用非托管代码参数传递的实现方法[J]. 软件导刊 2011(01)
    • [29].恶意代码与信息安全[J]. 硅谷 2011(18)
    • [30].代码证书遗失声明[J]. 大众标准化 2010(12)

    标签:;  ;  ;  ;  

    一种基于概率主题模型的恶意代码特征提取方法
    下载Doc文档

    猜你喜欢