1 模糊支持向量机
2 基于类中心的模糊隶属函数的局限性
3 局部离群因子的定义
3.1 实例的k距离邻域
3.2 局部可达密度
3.3 局部离群因子
3.4 基于离群因子的模糊隶属函数设计
4 数据验证
表1 UCI数据集及其相关属性 |
数据集 | 属性数 | 样本数 | 不平衡比 | 少数类 | 多数类 |
---|---|---|---|---|---|
teaching | 5 | 151 | 2.08 | Class1 | Class2,3 |
hepatitis | 19 | 155 | 3.84 | Class1 | Class2 |
Ecoli | 7 | 272 | 4.23 | class3 | Class1,2 |
Yeast | 8 | 514 | 9.09 | Class5 | Class1 |
chess-krvk-1 | 6 | 276 | 2.54 | class3 | Class6 |
chess-krvk-3 | 6 | 2 994 | 14.14 | Class6 | Class1 |
chess-krvk-4 | 6 | 2 012 | 73.52 | Class2 | Class12 |
表2 混淆矩阵 |
实际类别 | 预测类别 | |
---|---|---|
正类 | 负类 | |
正类 | ||
负类 |
表3 在teaching数据集上的分类结果 |
方法 | AUC | G-mean | F1 |
---|---|---|---|
FSVM | 0.758 1±0.019 9 | 0.676 5±0.025 2 | 0.576 5±0.031 4 |
RIFSVM | 0.759 2±0.028 5 | 0.728 5±0.025 5 | 0.640 2±0.030 0 |
FSVM-WD | 0.773 6±0.019 4 | 0.705 6±0.015 2 | 0.608 0±0.018 4 |
FSVM-SVDD | 0.767 7±0.021 3 | 0.675 1±0.028 0 | 0.571 9±0.034 6 |
EFSVM | 0.768 7±0.028 4 | 0.710 9±0.028 7 | 0.603 7±0.034 8 |
LOF-FSVM | 0.777 4±0.023 7 | 0.738 4±0.028 9 | 0.660 7±0.029 4 |
表4 在hepatitis数据集上的分类结果 |
方法 | AUC | G-mean | F1 |
---|---|---|---|
FSVM | 0.849 7±0.011 8 | 0.474 9±0.047 3 | 0.355 8±0.058 3 |
RIFSVM | 0.866 5±0.010 5 | 0.772 4±0.026 3 | 0.618 0±0.034 4 |
FSVM-WD | 0.865 4±0.011 1 | 0.772 0±0.019 3 | 0.593 5±0.023 2 |
FSVM-SVDD | 0.860 3±0.013 3 | 0.343 0±0.066 4 | 0.213 0±0.072 6 |
EFSVM | 0.865 2±0.015 1 | 0.666 3±0.028 0 | 0.537 8±0.035 4 |
LOF-FSVM | 0.871 9±0.010 1 | 0.810 4±0.017 2 | 0.644 9±0.023 0 |
表5 在Ecoli数据集上的分类结果 |
方法 | AUC | G-mean | F1 |
---|---|---|---|
FSVM | 0.997 2±0.004 2 | 0.797 7±0.014 7 | 0.752 6±0.019 3 |
RIFSVM | 0.999 1±0.001 6 | 0.984 8±0.012 0 | 0.540 9±0.014 2 |
FSVM-WD | 0.999 8±0.000 3 | 0.985 3±0.031 7 | 0.904 6±0.034 8 |
FSVM-SVDD | 0.998 7±0.000 9 | 0.866 1±0.039 3 | 0.839 1±0.044 4 |
EFSVM | 0.999 5±0.000 5 | 0.945 9±0.024 6 | 0.904 3±0.028 1 |
LOF-FSVM | 1.000 0±0.000 0 | 0.988 4±0.030 7 | 0.987 9±0.032 2 |
表6 在Yeast1数据集上的分类结果 |
方法 | AUC | G-mean | F1 |
---|---|---|---|
FSVM | 0.975 4±0.001 7 | 0.837 7±0.006 2 | 0.765 6±0.013 9 |
RIFSVM | 0.979 9±0.003 4 | 0.906 2±0.017 3 | 0.730 6±0.030 1 |
FSVM-WD | 0.979 4±0.001 7 | 0.896 1±0.008 2 | 0.706 0±0.011 7 |
FSVM-SVDD | 0.978 8±0.001 3 | 0.832 7±0.006 7 | 0.765 5±0.013 0 |
EFSVM | 0.978 7±0.001 3 | 0.855 3±0.009 2 | 0.756 9±0.012 8 |
LOF-FSVM | 0.979 9±0.001 7 | 0.889 8±0.008 4 | 0.770 5±0.010 9 |
表7 在chess-krvk-1数据集上的分类结果 |
方法 | AUC | G-mean | F1 |
---|---|---|---|
FSVM | 0.998 8±0.000 4 | 0.976 7±0.011 7 | 0.969 6±0.013 0 |
RIFSVM | 0.998 5±0.000 5 | 0.986 2±0.006 1 | 0.980 7±0.007 5 |
FSVM-WD | 0.998 9±0.000 3 | 0.985 4±0.002 5 | 0.980 7±0.003 0 |
FSVM-SVDD | 0.998 7±0.000 3 | 0.984 1±0.001 1 | 0.979 4±0.002 7 |
EFSVM | 0.998 9±0.000 2 | 0.984 7±0.002 4 | 0.980 0±0.003 6 |
LOF-FSVM | 0.999 0±0.000 2 | 0.988 6±0.002 6 | 0.982 1±0.004 0 |
表8 在chess-krvk-3数据集上的分类结果 |
方法 | AUC | G-mean | F1 |
---|---|---|---|
FSVM | 0.999 6±0.000 3 | 0.980 1±0.002 7 | 0.975 9±0.002 8 |
RIFSVM | 0.999 6±0.000 2 | 0.990 3±0.004 1 | 0.960 9±0.008 5 |
FSVM-WD | 0.999 7±0.000 1 | 0.992 1±0.003 0 | 0.947 2±0.004 5 |
FSVM-SVDD | 0.999 2±0.000 1 | 0.908 2±0.005 1 | 0.897 3±0.005 5 |
EFSVM | 0.999 7±0.000 1 | 0.974 9±0.001 9 | 0.963 5±0.004 4 |
LOF-FSVM | 0.999 8±0.000 1 | 0.993 6±0.003 2 | 0.973 7±0.003 4 |
表9 在chess-krvk-4数据集上的分类结果 |
方法 | AUC | G-mean | F1 |
---|---|---|---|
FSVM | 0.997 2±0.004 2 | 0.797 7±0.014 7 | 0.752 6±0.019 3 |
RIFSVM | 0.999 1±0.001 6 | 0.984 8±0.012 0 | 0.540 9±0.014 2 |
FSVM-WD | 0.999 8±0.000 3 | 0.985 3±0.031 7 | 0.904 6±0.034 8 |
FSVM-SVDD | 0.998 7±0.000 9 | 0.866 1±0.039 3 | 0.839 1±0.044 4 |
EFSVM | 0.999 5±0.000 5 | 0.945 9±0.024 6 | 0.904 3±0.028 1 |
LOF-FSVM | 1.000 0±0.000 0 | 0.988 4±0.030 7 | 0.987 9±0.032 2 |