• 论文
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会
一种软件缺陷不平衡数据分类新方法
  • 作者

    刘文英林亚林李克文雷永秀

  • 单位

    中国石油大学(华东)计算机科学与技术学院

  • 摘要
    针对软件缺陷预测数据中的数据不平衡、预测精度低以及特征维度高的问题,提出了一种RUS-RSMOTE-PCA-Vote的软件缺陷不平衡数据分类方法。首先通过随机欠采样来减少无缺陷样本的数量;在此基础上进行SMOTE过采样,在过采样中综合总体样本的分布状况引入影响因素posFac指导新样本的合成;对经过RUS-RSMOTE混合采样处理后的数据集进行PCA降维,最后应用Vote组合K最近邻、决策树、支持向量机构造集成分类器。在NASA数据集上的实验结果表明,与现有不平衡数据分类方法相比,所提方法在F-value值、G-mean值和AUC值上更优,有效地改善了软件缺陷预测数据集的分类性能。
  • 关键词

    软件缺陷预测不平衡数据混合采样特征降维集成分类器

  • 基金项目(Foundation)
    国家自然科学基金项目(61673396);山东省自然科学基金项目(ZR2017MF032);
  • 文章目录
    1 相关算法
    1.1 随机欠采样(Random under-sampling,RUS)
    1.2 SMOTE
    1.3 主成分分析
    1.4 Vote
    2 基于RUS-RSMOTE-PCA-Vote的软件缺陷不平衡数据分类方法
    2.1 改进的RSMOTE过采样方法
    2.2 基于RUS-RSMOTE-PCA-Vote的软件缺陷不平衡数据分类方法
    3 实验设计与分析
    3.1 实验对象
    3.2 实验评价指标
    3.3 实验设计与结果分析
    4 总结与展望
  • 引用格式
    刘文英,林亚林,李克文,雷永秀.一种软件缺陷不平衡数据分类新方法[J].山东科技大学学报(自然科学版),2021,40(02):84-94.
相关问题

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联