首页 > 其他分享 >吴恩达机器学习复习2:多重特征、多重变量的梯度下降、梯度下降实践Ⅰ:数据特征缩放、梯度下降实践Ⅱ:学习率、特征和多项式回归、正规方程法、向量化

吴恩达机器学习复习2:多重特征、多重变量的梯度下降、梯度下降实践Ⅰ:数据特征缩放、梯度下降实践Ⅱ:学习率、特征和多项式回归、正规方程法、向量化

时间:2022-10-09 23:24:14浏览次数:61  
标签:多重 函数 特征 梯度 下降 正规 theta

【多重特征】

多变量线性回归

可以有任何输入变量的等式的表示方法

 

 假设

 

 使用矩阵乘法的定义,我们的多变量假设功能可以被简洁地描述为

 

 这是未来我们为训练例子的准备的假设函数的向量化

【多重变量的梯度下降】

假设

参数

代价函数

 

 

 

 

 

 

梯度下降的步骤

原来的算法(n=1)

反复做{

角度0 = 原角度0-学习率 *(1/m)  求和[  假设函数值-实际函数值  ]

角度1 = 原角度1-学习率 *(1/m)  求和[(假设函数值-实际函数值)*  自变量  ]

}

新的算法(n>=1)

反复做{

角度j = 原角度1-学习率 *(1/m)  求和[(假设函数值-实际函数值)*  自变量  ]

}

 

【梯度下降实践Ⅰ:数据特征缩放】

思想: 使得确定的特征在一个相似的衡量尺度上

 

平均值归一化

把x换成x-μ,使特征接近大约零平均值

 

标准化

现在你知道了特征放大,如果你运用这个简单的技巧,它会让梯度下降运行得更快,并且在更小的迭代步数里收敛。

把你的输入值以粗略的相同的范围,加速梯度下降

【梯度下降实践Ⅱ:学习率】

 

debug除错:使得梯度下降正确工作

如何选择除错率?

找到你希望用来最小化代价函数的theta值

x轴代表梯度下降的迭代次数

 

 迭代100次后得到一个theta,又得出一个代价函数J(theta)。

 

 当梯度下降不能正常工作时

 

 有关学习率选择与梯度下降图像的选择题

 

 在图C中,代价函数值在增加,说明学习率太高了

A和B都收敛到一个代价函数的最优点,但是B收敛太慢了,说明学习率太低

 

总结:

学习率太小:收敛慢

学习率太大:代价函数随迭代次数增加而增加,甚至不收敛

 

{为梯度下降除错}

画一个该梯度下降的迭代次数与代价函数值的图
如果代价函数甚至增加了,你可能需要减小学习率啦

 

{自动收敛测试}

如果代价函数每次都比E(10的-3次方)减少得还要慢,说明是收敛的
然而实际上很难选择门槛值

 

【特征和多项式回归】

 

 

 提高特征和假设函数的形式,以一系列不同的方式

{多项式回归}

我们的假设函数不需要是线性,如果能和数据拟合得很好的话

我们可以改变行为或我们假设函数的曲线,通过制造一个二次的、三次的或平方根函数(或任何形式)

 

 注意:如果你以这种方式选择特征,那么特征缩放就变得很重要了!

【正规方程法】

 在正规方程法的方法中,通过对theta j求导,最小化代价函数,然后把它们设为0.

这让我们得以不用迭代就能找到最优化值。

 

 不需要用正规方程法做特征缩放

*梯度下降法和正规方程法的比较

 

 用正规方程法计算转置有O(n^3)的复杂度

所以如果我们有更大数量的特征,那么用正规方程法就会很慢。

实际上,当n超过1万时,从正规解法到迭代过程会有一个很好的时间。

 

 正规方程的不可逆

在matlab里执行正规方程时,我们一般用pinv功能,它能返回theta值(即使X^TX不可逆的时候)

常见的原因是:

1.冗余的特征,有两个特征是相关的(尽管不是线性独立)

2.太多的特征了。在本例中,删除一些特征或使用归一化

解决方法:

1.删除互相线性独立的一个特征

2.如果特征太多了,删除一个或多个特征

【向量化】

 向量化的例子

h(x)=sum(theta_j*x_j)=theta^T*x

 

 

 

 

 

 

%matlab
%未向量化执行法
prediction=0.0;
for j=1:n+1;
    prediction=prediction+theta(j)*x(j)
end;

double prediction =0.0;
for(int j = 0;j<=n;j++)
    prediction+=theta[j]*x[j];


%向量化执行方法
prediction=theta'*x;

double prediction=theta.transpose()*x;

 

标签:多重,函数,特征,梯度,下降,正规,theta
From: https://www.cnblogs.com/asandstar/p/16772431.html

相关文章

  • 关于 多重背包
    问题描述:有N种物品和一个容量为V的背包,第i件物品最多有Si 件。每件体积是w[i],价值是v[i]。求解将哪些物品装入背包可使价值总和最大。问题特点:第i件物品......
  • 多重积分合元 - 余面积公式法
    该定理由Songby提出.余面积公式\[\iint\limits_Dg(x,y)\textdS=\int_a^b\int\limits_Lg(x,y)\frac{\textdy}{f_x}\textdz\]我们来证明这个定理.画出\(f(x......
  • 继承脸部特征揭开后代的神秘面纱
    通过已知任意两张面部图片重新生成新面孔,使得新面部符合已知图像的特征,这在预测亲属或后代的面部场景中有着特殊意义。这当然是一个有趣的问题,图龙解“变脸934”在解决这类......
  • 递归特征金字塔+可切换空洞卷积提升目标检测性能(附框架源码)
    “计算机视觉研究院”计算机视觉研究院专栏作者:Edison_G许多现代的目标检测器通过两次look和think的机制表现出优异的性能。 今天分享的是在目标检测的主干设计中探讨了这......
  • VC R-CNN | 无监督的视觉常识特征学习(附源码)
    计算机视觉研究院专栏作者:Edison_G最近CVPR不是在线直播,我关注了下,发现一篇很有意思的paper。让我想到在研究生有做过类似的算法——因果关系。今天我们看看这位作者是怎么......
  • 局部人脸识别的动态特征匹配(文末附文章及源码地址)
    【导读】该文章被Trans收录。无约束环境下的局部人脸识别(PFR)是一项非常重要的任务,尤其是在视频监控和移动设备等由于遮挡、视野外、大视角等原因容易捕捉到局部人脸图像的......
  • 云原生是什么?细数云原生的5大特征
     云原生是什么?细数云原生的5大特征 导读:随着公有云和私有云的广泛部署,云计算基础设施成为企业部署新业务的首选。可以说,云计算已进入下半场,各大云计算服务商的......
  • ES6新特征高阶函数
    <!DOCTYPEhtml><htmllang="en"><head> <metacharset="UTF-8"> <metahttp-equiv="X-UA-Compatible"content="IE=edge"> <metaname="viewport"content="......
  • 恶意代码分析实战 恶意代码的网络特征 lab14-1 14-2 14-3 都是http c2,并用到了自定义
       先反编译看看:函数在做base64加密:   验证下想法,果然:后面的功能,就是在下载执行了:   我们分析下细节: 问题1:使用wireshark进行监控网络特征,运......
  • css多重背景
    background-size(背景尺寸)background-origin(定义背景图像的位置)background-clip(背景的绘制区域)多重背景CSS允许您通过background-image属性为一个元素添加多幅背......