这个图表展示了二分类问题中常用的各种评价指标及其计算公式。以下是对每个指标的详细分析和总结:
图表结构分析
-
总样本数 (Total population):
- ( P + N ):总样本数,包括正类样本和负类样本。
-
实际情况 (Actual Condition):
- 正类 (Positive, P):实际为正类的样本数。
- 负类 (Negative, N):实际为负类的样本数。
-
预测情况 (Predicted Condition):
- 预测为正类 (Predicted Positive, PP):被预测为正类的样本数。
- 预测为负类 (Predicted Negative, PN):被预测为负类的样本数。
-
混淆矩阵 (Confusion Matrix):
- 真正类 (True Positive, TP):实际为正类且被正确预测为正类的样本数。
- 假负类 (False Negative, FN):实际为正类但被错误预测为负类的样本数。
- 假正类 (False Positive, FP):实际为负类但被错误预测为正类的样本数。
- 真负类 (True Negative, TN):实际为负类且被正确预测为负类的样本数。
各指标的含义及意义
-
准确率 (Accuracy, ACC):
- 公式:( \(\text{ACC} = \frac{TP + TN}{P + N}\) )
- 含义:预测正确的样本数占总样本数的比例。
- 意义:衡量模型整体的预测准确性。
-
精确率 (Precision, PPV):
- 公式:( $\text{PPV} = \frac{TP}{TP + FP} $)
- 含义:预测为正类的样本中实际为正类的比例。
- 意义:衡量模型在预测正类时的准确性。
-
召回率 (Recall, TPR):
- 公式:( \(\text{TPR} = \frac{TP}{P}\) )
- 含义:实际为正类的样本中被正确预测为正类的比例。
- 意义:衡量模型对正类样本的识别能力。
-
特异性 (Specificity, TNR):
- 公式:( \(\text{TNR} = \frac{TN}{N}\) )
- 含义:实际为负类的样本中被正确预测为负类的比例。
- 意义:衡量模型对负类样本的识别能力。
-
假正率 (False Positive Rate, FPR):
- 公式:( \text{FPR} = \frac{FP}{N} )
- 含义:实际为负类的样本中被错误预测为正类的比例。
- 意义:衡量模型在负类样本中的误报率。
-
假负率 (False Negative Rate, FNR):
- 公式:( \(\text{FNR} = \frac{FN}{P}\) )
- 含义:实际为正类的样本中被错误预测为负类的比例。
- 意义:衡量模型在正类样本中的漏报率。
-
F1分数 (F1 Score):
- 公式:( \(\text{F1} = \frac{2 \cdot \text{PPV} \cdot \text{TPR}}{\text{PPV} + \text{TPR}}\) )
- 含义:精确率和召回率的调和平均数。
- 意义:综合衡量模型的精确率和召回率。
-
平衡准确率 (Balanced Accuracy, BA):
- 公式:( \(\text{BA} = \frac{TPR + TNR}{2}\) )
- 含义:召回率和特异性的平均值。
- 意义:在类别不平衡的情况下,衡量模型的整体表现。
-
Matthews相关系数 (Matthews Correlation Coefficient, MCC):
- 公式:( \(\text{MCC} = \frac{TP \cdot TN - FP \cdot FN}{\sqrt{(TP + FP)(TP + FN)(TN + FP)(TN + FN)}}\) )
- 含义:考虑了TP、TN、FP和FN的综合指标。
- 意义:在类别不平衡的情况下,衡量模型的分类性能。
-
诊断比值比 (Diagnostic Odds Ratio, DOR):
-
公式:( \(\text{DOR} = \frac{TP \cdot TN}{FP \cdot FN}\) )
-
含义:真正类和假正类的比值与假负类和真负类的比值之比。
-
意义:衡量模型区分正类和负类的能力。
-
-
假发现率 (False Discovery Rate, FDR):