导读:本文包含了软件缺陷度量论文开题报告文献综述及选题提纲参考文献,主要关键词:数据度量,数据挖掘,多目标决策,软件缺陷检测
软件缺陷度量论文文献综述
陈顺义[1](2018)在《基于数据度量和多目标决策的软件缺陷技术研究》一文中研究指出软件缺陷是软件开发过程中不可避免的“副产品”,不仅影响着软件的质量还可能导致软件的开发费用超支和开发进度失控,甚至会导致灾难性的结果。软件中存在的缺陷并非靠简单地检测和验证手段就能发现或排除的,因此,软件缺陷检测技术必不可少。一方面,在以往的研究过程中,软件缺陷检测模型的研究思路焦点都聚集在分类器的设计上,而忽略了数据复杂性特征。另一方面,检测模型评估指标多种多样,很难直观的判断出哪些模型指标是否是合格或者说是有利的,因此拥有稳定的评估技术是非常重要的。针对上诉问题,本文提出基于数据度量的软件缺陷检测方法和基于多目标决策的评估方法研究:(1)提出了基于数据度量的软件缺陷检测方法,其将数据挖掘技术中数据复杂性度量应用到软件工程的软件缺陷检测模型中。首先引入11个数据复杂性度量指标对所有数据进行度量,然后使用当前较流行的叁种数据挖掘算法最近邻分类算法、决策树算法和朴素贝叶斯分类算法对所有数据进行检测,并采用多个评估指标来表示,最后根据实验结果探讨数据集的复杂性度量与软件缺陷检测之间的关系,从而为软件缺陷检测模型的建立提供有力的支持。实验结论表明,数据复杂度量可以为分类器的选择提供有效的信息,同时为建立稳定的检测模型提供了有力的支撑。(2)提出了一种基于多目标决策算法的评估方法。多目标决策算法主要采用的方法是层次分析法(Analytic Hierarchy Process,AHP)和模糊数学法,该技术适用解决多输入以及多输出的问题。在后期实验中主要采用了层次分析法作为建模对象,以及会涉及到层次分析法的一些变形的方法模糊层次分析法(Fuzzy AHP)等。首先,将影响因素分解成目标、准则、方案等层次,在此基础之上在使用层次分析法对决策进行定性和定量分析。使用了机器学习中多个度量指标建立多目标决策评估方法,所得的数据来确立优化的评估算法。然后,在层次分析法上进行变形成Fuzzy AHP模型进行相同试验,比较二者的不同之处,以及实验结果。最后,分析出所要的多目标决策模型。实验的结论展示了通过层次分析法得出的一个解再通过Fuzzy AHP的方法,可以将其转化为定量分析,在5个划分的标准之中找到对于该解的评价,以确定该解是否符合预期。(本文来源于《华侨大学》期刊2018-07-21)
王铁建[2](2018)在《基于度量的软件缺陷预测研究》一文中研究指出软件系统在人类社会中有着日益广泛而深入的应用,其可靠性十分重要。随着软件系统规模与复杂度的迅速增长,在资源有限的情况下,完全依赖传统的软件测试方法很难找出软件系统当中的全部缺陷。静态软件缺陷预测技术能够借助通过软件度量获得的历史数据,利用机器学习方法构造出软件缺陷预测模型,进而对新的软件模块进行预测,判定这些新模块当中是否存在缺陷,为提高软件系统的可靠性提供有效的决策支持。软件缺陷预测包括获取模块标记、提取模块特征、构造预测模型、进行缺陷预测等基本步骤。缺陷预测所用的历史数据是通过进行软件度量获得的,这些缺陷数据存在结构复杂、类不平衡、标记样本不足、不同数据集等问题;此外,在进行软件缺陷预测的过程中,还需要考虑误判风险成本问题。针对上述软件缺陷预测当中的问题,提出了核字典学习、多核集成学习、半监督集成学习等软件缺陷预测方法。论文的研究内容主要包含如下方面:(1)提出了一种基于核字典学习的软件缺陷预测方法。将核方法与字典学习结合起来,首先根据软件缺陷历史数据结构复杂、类不平衡的特点,利用核方法将软件缺陷历史数据映射到一个能代表原始数据分布的高维特征空间。然后在核空间中,通过学习得到一个核字典,利用这个核字典判定软件模块的标记,对软件模块进行缺陷预测。在核字典学习过程中,采用了一种核字典基选择策略,构造出一个类别平衡的核字典,解决了软件缺陷预测当中的类不平衡问题。(2)提出了一种基于多核集成学习的软件缺陷预测方法。多核集成学习方法能够利用集成学习来获得最优的多核分类器,使得该方法在用于软件缺陷预测时,能够兼有多核学习与集成学习的优点。考虑到软件缺陷预测中的风险成本,设计了一种新的样本集权重向量更新策略,在多核集成学习的训练过程中,根据分类结果,逐步增加有缺陷模块权重,同时降低无缺陷模块的权重,从而增加对有缺陷模块的关注程度,降低把有缺陷模块预测为无缺陷模块的风险,提高软件缺陷预测的效果。(3)提出了一种基于半监督集成学习的软件缺陷预测方法。将半监督学习与集成学习结合起来,不仅能够充分利用大量存在的未标记模块进行训练,在标记样本不足的情况下增强对分类器的训练,同时还能够解决软件缺陷历史数据本身存在的类不平衡问题,从而提高软件缺陷的预测效果。考虑到相似度矩阵的重要作用,在求取相似度矩阵时,采用了非负稀疏编码的方法,以获得更加稳定学习效果更好的相似度矩阵,提高半监督集成学习的缺陷预测效果。在NASA MDP数据集上的实验表明,论文当中提出的核字典学习缺陷预测方法、多核集成学习缺陷预测方法、半监督集成学习缺陷预测方法均获得了较好的软件缺陷预测效果。(本文来源于《武汉大学》期刊2018-05-01)
娄丰鹏,吴迪,荆晓远,吴飞[3](2018)在《增加度量元的迁移学习跨项目软件缺陷预测》一文中研究指出目前,结合机器学习方法和软件缺陷预测技术自动地学习模型来发现软件中的缺陷,已经成为跨项目缺陷预测的主要方法。由于源项目和目标项目之间的特征分布差异,跨项目相关性预测的表现通常较差。针对该问题,可以使用从源项目中提取知识并将其转移到目标项目的转移学习技术来提高预测性能,并提出了一种增加度量元的迁移学习方法进行跨项目的软件缺陷预测。该方法首先使用分类器对数据集进行一次项目内预测,并将预测结果作为新的度量元加入数据集。然后采用迁移学习方法将源项目中提取的知识转移至目标项目,并使用分类器预测目标项目。在AEEEM数据集上的实验结果表明,该算法提高了跨项目软件缺陷预测效率。(本文来源于《计算机技术与发展》期刊2018年07期)
史作婷,吴迪,荆晓远,吴飞[4](2018)在《类不平衡稀疏重构度量学习软件缺陷预测》一文中研究指出软件缺陷预测是提升软件质量的重要手段。为了改善缺陷预测性能,目前许多机器学习领域的最新成果已经引入到软件缺陷预测中。但是,软件缺陷预测数据通常存在类别分布不平衡的问题,这会影响预测效果。针对这个问题,提出了类不平衡稀疏重构距离度量学习软件缺陷预测方法。该方法首先在度量学习中加入代价敏感因素,学习距离度量特征矩阵并解决软件缺陷预测中分类错误代价不同的问题。其次,通过在目标函数中加入权重来进一步提高小类样本距离度量学习的准确性。最后,为了解决预测阶段数据集的类别不平衡问题,采用了改进加权KNN算法预测测试样本标签。在NASA软件缺陷预测标准数据集上的实验结果证明了该方法能提高召回率与F-measure值,改善分类性能。(本文来源于《计算机技术与发展》期刊2018年06期)
Qiao,YU,Shu-juan,JIANG,Rong-cun,WANG,Hong-yang,WANG[5](2017)在《一种面向软件缺陷预测的相似性度量特征选择方法(英文)》一文中研究指出软件缺陷预测旨在通过历史数据和能反映软件模块特性的软件特征来发现潜在缺陷。然而,有的特征可能与类别(有缺陷或无缺陷)的相关性较高,有的特征可能是冗余的或无关的。针对软件缺陷预测中不同特征与类别的相关性差异,本文提出一种基于相似性度量(similarity measure,SM)的特征选择方法。首先,根据不同类样本间的相似性来更新特征权重;然后,按照特征权重值降序排列生成特征排序列表,并依次选取特征排序列表中的所有特征子集;最后,在KNN(k-nearest neighbor)模型上验证所有特征子集的分类性能,并采用AUC(area under curve)指标进行度量。在11个美国航空航天局(NASA)数据集上进行实验验证,结果表明,与其它四种特征选择方法相比,本文方法具有与之相当甚至更高的分类性能。(本文来源于《Frontiers of Information Technology & Electronic Engineering》期刊2017年11期)
王晴[6](2016)在《基于距离度量学习的软件缺陷预测方法研究》一文中研究指出随着计算机技术的不断发展,如何准确地预测出软件中潜在的缺陷显得至关重要。有效地利用软件开发工程中的历史数据,帮助预测新开发的软件工程中的缺陷信息,既能提升软件开发质量,也能很大程度上节省软件测试工作量。近年来,研究者们尝试把一些机器学习方法应用到软件缺陷预测领域中,但是这些方法在训练模型的过程中大多使用传统的欧氏距离。许多研究表明,欧氏距离并不能很好地体现样本之间的鉴别性。距离度量学习方法通过挖掘训练样本集的特征信息和标记信息,学习得到有效的距离度量,让样本在基于度量矩阵的新特征空间中具有更好的鉴别可分性。本文从距离度量学习的角度出发,提出了一系列有效的基于距离度量学习的软件缺陷预测方法。首先,本文提出了基于特定簇大间隔最近邻距离度量学习的软件缺陷预测方法(CS-LMNN)。该方法的基本思路是,首先使用大间隔最近邻距离度量学习方法(LMNN)学习一个全局鉴别度量矩阵,然后再把训练集使用聚类算法聚类为K个簇,每个簇学习各自的特定簇鉴别度量矩阵。在预测时,先用全局鉴别度量方式为测试样本选定近邻样本所在的簇,然后再使用该特定簇的鉴别度量方式预测出测试样本是否有缺陷。其次,为了解决训练集中存在的噪声问题,本文在距离度量学习中融入局部稀疏重构信息,提出基于特定簇局部稀疏重构距离度量学习的软件缺陷预测方法(CS-LSRML)。该方法的基本思路是,利用距离度量矩阵计算稀疏表示项,并融入了局部加权因子,设计了类内局部稀疏重构项和类间局部稀疏重构项。该方法既可以学习鉴别性很好的度量矩阵,又融入了稀疏表示中对噪声鲁棒的优点。最后,为了解决软件缺陷预测中的数据类不平衡问题,本文又融合了上采样和下采样技术,提出了基于上采样的特定簇局部稀疏重构距离度量学习的软件缺陷预测方法(OCS-LSRML)和基于下采样的特定簇局部稀疏重构距离度量学习的软件缺陷预测方法(UCS-LSRML)。这两个方法的基本思路是,先通过两种采样技术,将不平衡数据集转换为相对平衡的数据集,然后再使用上面提出的距离度量学习方法学习全局鉴别度量矩阵和特定簇鉴别度量矩阵。本文在NASA、AEEEM和ReLink软件工程数据库进行实验。实验结果充分验证了本文所提方法的有效性,并且和目前代表性软件缺陷预测方法的效果相比,有一定程度的提高。(本文来源于《南京邮电大学》期刊2016-11-18)
王晴,荆晓远,朱阳平,吴飞,董西伟[7](2016)在《基于局部稀疏重构度量学习的软件缺陷预测》一文中研究指出随着计算机技术的不断发展,如何准确地预测出软件中潜在的缺陷显得至关重要。近年来,研究者们尝试把一些机器学习方法应用到软件缺陷预测领域中,但是这些方法在分类过程中大多使用了传统的欧氏距离。距离度量学习方法通过挖掘训练样本集的特征信息和标记信息,学习得到有效的距离度量,让样本在基于度量矩阵的新特征空间中具有更好的鉴别可分性。将距离度量学习方法引入到软件缺陷预测中,同时融入了局部稀疏重构信息,提出一种新的软件缺陷预测方法,即局部稀疏重构度量学习方法(LSRML)。该方法学习得到的距离度量具有很好的鉴别性,并有效地解决了噪声敏感问题。在软件工程NASA数据库上的实验结果表明,提出的方法具有较好的缺陷预测效果。(本文来源于《计算机技术与发展》期刊2016年11期)
尤艺,段洪栋,王瀚超[8](2015)在《缺陷密度法的软件测试质量度量分析技术》一文中研究指出阐述了航天型号软件测试质量度量的现状,通过构建缺陷度量测试工具平台,提供了一种软件确认测试项目的质量数据统计方法和分析预测方法,指导嵌入式、非嵌入式及FPGA等各类软件第叁方确认测试过程中软件缺陷的发现,提高软件测试的充分性和有效性。分别从测试度量平台搭建的重要性以及该平台应用于测试过程中软件缺陷度量、分析及预测等方面进行深入剖析,为提高软件测试的效率,发现软件开发设计缺陷提供有效真实的依据和方法。(本文来源于《计算机仿真》期刊2015年08期)
常瑞花,贾鹏[9](2015)在《基于度量元的静态软件缺陷预测技术》一文中研究指出软件缺陷预测技术是当前软件工程领域的一个热点研究问题。回顾和综述了基于度量元的静态软件缺陷预测技术研究的起源与国内外最新进展动态,并对常用缺陷预测技术的评价指标进行对比和分析,指出其优缺点和适用范围。最后对静态软件缺陷预测技术的可能发展方向进行预测。(本文来源于《火力与指挥控制》期刊2015年02期)
许浩[10](2014)在《基于CMMI软件缺陷度量的实用模型建构及应用》一文中研究指出近年来,随着软件在各个行业的广泛应用,人们对于稳定性更高、用户体验更好的软件需求日益增长。从来质量都是人们关注的问题,软件的质量也被提到关注的高度平台上,软件开发商们对自身的软件质量和其软件用户体验情况的关注是自身能够在这个行业中保持不断的竞争力和占领市场的重要控制点。所以在软件行业中经常被人讨论的就是如何去改进和管理自身的软件,从而更有效的在市场上保持自身竞争活力。基于“软件缺陷数据是软件过程改进决策最重要的管理信息来源”的论断,那么本文主要是从软件缺陷管理的方面上展开研究和分析,从分析软件的缺陷度量开始,同时在加强了解软件度量的理论知识和数据挖掘的算法基础上,着重的分析CMMI体系。在这个体系中,企业的能力和量化管理的要求是成正比的,能力越高,那么要求也就有所提高,其度量的关键就是软件缺陷度量。本文将基于CMMI模型的软件缺陷度量框架,建立一个结合GQIM度量模型的新模型。新模型的论述缺陷度量的主要侧重点是:计划度量、实施度量、评价度量和过程改进四个方面。在软件的分析过程中结合数据挖掘异常点检测算法和聚类算法K-means进行整合,主要对缺陷数据进行度量分析,进而深挖在软件过程里比较有益的信息和质控点,从而能够帮助企业在软件管理中精细化管理软件缺陷,提高软件的成熟度等级。在论文的最后部分,本文主要是理论联系实际,运用CMMI软件缺陷度量的实用模型结合数据挖掘算法在实际项目中进行实施。主要步骤有包含:度量构造、度量指标选取、度量计划制定和度量过程实施这四个部分。之后运用数据挖掘算法、软件度量分析技术进行量化分析软件缺陷数据,运用软件模拟分析的结果将作为在后期的实际开发和研究中重要的经验,使软件开发过程更加平稳更加有效。(本文来源于《北京工业大学》期刊2014-12-01)
软件缺陷度量论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
软件系统在人类社会中有着日益广泛而深入的应用,其可靠性十分重要。随着软件系统规模与复杂度的迅速增长,在资源有限的情况下,完全依赖传统的软件测试方法很难找出软件系统当中的全部缺陷。静态软件缺陷预测技术能够借助通过软件度量获得的历史数据,利用机器学习方法构造出软件缺陷预测模型,进而对新的软件模块进行预测,判定这些新模块当中是否存在缺陷,为提高软件系统的可靠性提供有效的决策支持。软件缺陷预测包括获取模块标记、提取模块特征、构造预测模型、进行缺陷预测等基本步骤。缺陷预测所用的历史数据是通过进行软件度量获得的,这些缺陷数据存在结构复杂、类不平衡、标记样本不足、不同数据集等问题;此外,在进行软件缺陷预测的过程中,还需要考虑误判风险成本问题。针对上述软件缺陷预测当中的问题,提出了核字典学习、多核集成学习、半监督集成学习等软件缺陷预测方法。论文的研究内容主要包含如下方面:(1)提出了一种基于核字典学习的软件缺陷预测方法。将核方法与字典学习结合起来,首先根据软件缺陷历史数据结构复杂、类不平衡的特点,利用核方法将软件缺陷历史数据映射到一个能代表原始数据分布的高维特征空间。然后在核空间中,通过学习得到一个核字典,利用这个核字典判定软件模块的标记,对软件模块进行缺陷预测。在核字典学习过程中,采用了一种核字典基选择策略,构造出一个类别平衡的核字典,解决了软件缺陷预测当中的类不平衡问题。(2)提出了一种基于多核集成学习的软件缺陷预测方法。多核集成学习方法能够利用集成学习来获得最优的多核分类器,使得该方法在用于软件缺陷预测时,能够兼有多核学习与集成学习的优点。考虑到软件缺陷预测中的风险成本,设计了一种新的样本集权重向量更新策略,在多核集成学习的训练过程中,根据分类结果,逐步增加有缺陷模块权重,同时降低无缺陷模块的权重,从而增加对有缺陷模块的关注程度,降低把有缺陷模块预测为无缺陷模块的风险,提高软件缺陷预测的效果。(3)提出了一种基于半监督集成学习的软件缺陷预测方法。将半监督学习与集成学习结合起来,不仅能够充分利用大量存在的未标记模块进行训练,在标记样本不足的情况下增强对分类器的训练,同时还能够解决软件缺陷历史数据本身存在的类不平衡问题,从而提高软件缺陷的预测效果。考虑到相似度矩阵的重要作用,在求取相似度矩阵时,采用了非负稀疏编码的方法,以获得更加稳定学习效果更好的相似度矩阵,提高半监督集成学习的缺陷预测效果。在NASA MDP数据集上的实验表明,论文当中提出的核字典学习缺陷预测方法、多核集成学习缺陷预测方法、半监督集成学习缺陷预测方法均获得了较好的软件缺陷预测效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
软件缺陷度量论文参考文献
[1].陈顺义.基于数据度量和多目标决策的软件缺陷技术研究[D].华侨大学.2018
[2].王铁建.基于度量的软件缺陷预测研究[D].武汉大学.2018
[3].娄丰鹏,吴迪,荆晓远,吴飞.增加度量元的迁移学习跨项目软件缺陷预测[J].计算机技术与发展.2018
[4].史作婷,吴迪,荆晓远,吴飞.类不平衡稀疏重构度量学习软件缺陷预测[J].计算机技术与发展.2018
[5].Qiao,YU,Shu-juan,JIANG,Rong-cun,WANG,Hong-yang,WANG.一种面向软件缺陷预测的相似性度量特征选择方法(英文)[J].FrontiersofInformationTechnology&ElectronicEngineering.2017
[6].王晴.基于距离度量学习的软件缺陷预测方法研究[D].南京邮电大学.2016
[7].王晴,荆晓远,朱阳平,吴飞,董西伟.基于局部稀疏重构度量学习的软件缺陷预测[J].计算机技术与发展.2016
[8].尤艺,段洪栋,王瀚超.缺陷密度法的软件测试质量度量分析技术[J].计算机仿真.2015
[9].常瑞花,贾鹏.基于度量元的静态软件缺陷预测技术[J].火力与指挥控制.2015
[10].许浩.基于CMMI软件缺陷度量的实用模型建构及应用[D].北京工业大学.2014