2023-03-06 16:54:15 星期一
接下来讨论y是离散值情况下的分类问题
分类问题举例
此时y是有两个取值的变量:0 or 1
0表示负类:没有某个东西
1表示正类:有某个东西
开发一个分类算法
eg.对肿瘤进行恶性和良性分类
1:有肿瘤
0:没有肿瘤
将线性回归算法应用到这个数据集,用直线对数据进行拟合
此时想做出预测,将分类器输出的阈值设为0.5,即纵坐标值为0.5
用线性回归后,在0.5这个点右边的值预测为正,左边预测为负。
延长横轴,此时有另一个训练样本
此时训练样本增加一个点,运用线性回归,会得到另一条直线去拟合数据,现在阈值设为0.5得到的预测结果就不准确(蓝色线)
此时,数据的拟合直线从红色变成蓝色,从而生成了一个更坏的假设
So.
把线性回归应用于分类问题并不是一个好主意
把线性回归用于分类问题,会发生什么?
对于分类问题:y = 0 or 1
使用线性回归时假设的输出值会远大于1或远小于0,即使所有训练样本的标签都是y = 0 or 1
逻辑回归算法(logistic regression)
算法的预测或者输出值一直介于0和1之间,logistic regression是一种分类算法,而不是回归算法
标签:吴恩达,回归,分类,0.5,算法,logistic,线性,regression From: https://www.cnblogs.com/yabii/p/17184674.html