衡量二分类模型精度的一种指标,兼顾了分类模型的精确率(precision)和召回率(recall)。是精确率和召回率的调和平均数,最大为 1,最小为 0
precision & recall
二分类问题分类的结果有下面的几种情况:
预测\真实 | 正例 | 反例 |
---|---|---|
正例 | 预测正确(True Positive) | 错误的将其他类预测为本类(False Positive) |
反例 | 本类标签预测成其他类(False Nagtive) | 预测反例正确(True Negative) |
上面的各种预测情况可以简写成
\[TP+FP+TN+FN = 样例总数 \]有两个重要的衡量指标,分别是:
- precision:又叫精准度/查准度,指分类器预测为正例中分类正确的比例
- recall:召回率/查全率,被预测为正例的样本占真实正例的比重
- accuracy
为什么需要 F-Measure
一般来说,查准率高是,查全率往往偏低;而查全率高时,查准率往往偏低(要使查准率高,最容易的事情就是将所有的样本都判定为正类,那就会误报很多)。\(F-Measure\) 可以在查准率和查全率之间取得一个平衡。
\[F_{\beta} = (1+\beta) \cdot \frac{precision \cdot recall}{\beta^2 precision + recall} \]\(\beta\) 代表 precision 的重要程度是 recall 的 \(\beta\) 倍。
当 \(\beta = 1\) 时,就得到了 \(F_{1}\)。
\[F_{1}=2\cdot\frac{p r e cisi o n\cdot r e c a l l}{p r e cisi o n+r e c a l l} \]应用
- [[IMDL中的F-Measure]]