以下是 准确率 (Accuracy)、精确率 (Precision) 和 召回率 (Recall) 的详细定义和解释:
1. 准确率 (Accuracy)
定义:准确率是指模型预测正确的样本占总样本的比例。
公式:
- TP (True Positive):真正例,正确预测为正类的样本数量。
- TN (True Negative):真负例,正确预测为负类的样本数量。
- FP (False Positive):假正例,错误预测为正类的样本数量。
- FN (False Negative):假负例,错误预测为负类的样本数量。
解释:准确率是一个常用的性能指标,但在类别不平衡的情况下可能会产生误导。例如,如果大多数样本是负类,模型只需简单地预测所有样本为负类即可获得高准确率。
2. 精确率 (Precision)
定义:精确率是指模型预测为正类的样本中,实际为正类的比例。
公式:
解释:精确率衡量的是模型在预测为正类时的准确性。在某些应用中(如疾病筛查),我们希望尽量减少假阳性,因为假阳性可能导致不必要的后续检查或治疗。
3. 召回率 (Recall)
定义:召回率是指实际为正类的样本中,被模型正确预测为正类的比例。
公式:
解释:召回率衡量的是模型对正类样本的识别能力。在某些情况下(如癌症检测),我们希望尽量减少假阴性,因为漏掉一个真实的阳性样本可能会导致严重后果。
总结
- 准确率:整体预测的正确性,适用于类别均衡的情况。
- 精确率:关注正类预测的准确性,适用于对假阳性敏感的情况。
- 召回率:关注正类的识别能力,适用于对假阴性敏感的情况。
在实际应用中,通常需要综合考虑这三个指标,特别是在类别不平衡的情况下,可以使用 F1-score(精确率和召回率的调和平均)来平衡这两个指标。
参考了准确度(accuracy)、精确率(precision)、召回率(recall)、F1值。
标签:准确率,预测,Recall,样本,Precision,正类,精确,召回,Accuracy From: https://www.cnblogs.com/fiveyang/p/18470281