吴恩达机器学习复习2：多重特征、多重变量的梯度下降、梯度下降实践Ⅰ：数据特征缩放、梯度下降实践Ⅱ：学习率、特征和多项式回归、正规方程法、向量化

时间：2022-10-09 23:24:14浏览次数：62

标签：多重函数特征梯度下降正规 theta

【多重特征】

多变量线性回归

可以有任何输入变量的等式的表示方法

假设

使用矩阵乘法的定义，我们的多变量假设功能可以被简洁地描述为

这是未来我们为训练例子的准备的假设函数的向量化

【多重变量的梯度下降】

假设

参数

代价函数

梯度下降的步骤

原来的算法（n=1）

反复做{

角度0 = 原角度0-学习率 *(1/m) 求和[ 假设函数值-实际函数值 ]

角度1 = 原角度1-学习率 *(1/m) 求和[（假设函数值-实际函数值）* 自变量 ]

}

新的算法（n>=1）

反复做{

角度j = 原角度1-学习率 *(1/m) 求和[（假设函数值-实际函数值）* 自变量 ]

}

【梯度下降实践Ⅰ：数据特征缩放】

思想：使得确定的特征在一个相似的衡量尺度上

平均值归一化

把x换成x-μ，使特征接近大约零平均值

标准化

现在你知道了特征放大，如果你运用这个简单的技巧，它会让梯度下降运行得更快，并且在更小的迭代步数里收敛。

把你的输入值以粗略的相同的范围，加速梯度下降

【梯度下降实践Ⅱ：学习率】

debug除错：使得梯度下降正确工作

如何选择除错率？

找到你希望用来最小化代价函数的theta值

x轴代表梯度下降的迭代次数

迭代100次后得到一个theta，又得出一个代价函数J(theta)。

当梯度下降不能正常工作时

有关学习率选择与梯度下降图像的选择题

在图C中，代价函数值在增加，说明学习率太高了

A和B都收敛到一个代价函数的最优点，但是B收敛太慢了，说明学习率太低

总结：

学习率太小：收敛慢

学习率太大：代价函数随迭代次数增加而增加，甚至不收敛

{为梯度下降除错}

画一个该梯度下降的迭代次数与代价函数值的图
如果代价函数甚至增加了，你可能需要减小学习率啦

{自动收敛测试}

如果代价函数每次都比E（10的-3次方）减少得还要慢，说明是收敛的
然而实际上很难选择门槛值

【特征和多项式回归】

提高特征和假设函数的形式，以一系列不同的方式

{多项式回归}

我们的假设函数不需要是线性，如果能和数据拟合得很好的话

我们可以改变行为或我们假设函数的曲线，通过制造一个二次的、三次的或平方根函数（或任何形式）

注意：如果你以这种方式选择特征，那么特征缩放就变得很重要了！

【正规方程法】

在正规方程法的方法中，通过对theta j求导，最小化代价函数，然后把它们设为0.

这让我们得以不用迭代就能找到最优化值。

不需要用正规方程法做特征缩放

*梯度下降法和正规方程法的比较

用正规方程法计算转置有O(n^3)的复杂度

所以如果我们有更大数量的特征，那么用正规方程法就会很慢。

实际上，当n超过1万时，从正规解法到迭代过程会有一个很好的时间。

正规方程的不可逆

在matlab里执行正规方程时，我们一般用pinv功能，它能返回theta值（即使X^TX不可逆的时候）

常见的原因是：

1.冗余的特征，有两个特征是相关的（尽管不是线性独立）

2.太多的特征了。在本例中，删除一些特征或使用归一化

解决方法：

1.删除互相线性独立的一个特征

2.如果特征太多了，删除一个或多个特征

【向量化】

向量化的例子

h(x)=sum(theta_j*x_j)=theta^T*x

%matlab
%未向量化执行法
prediction=0.0;
for j=1:n+1;
    prediction=prediction+theta(j)*x(j)
end;

double prediction =0.0;
for(int j = 0;j<=n;j++)
    prediction+=theta[j]*x[j];


%向量化执行方法
prediction=theta'*x;

double prediction=theta.transpose()*x;

标签：多重,函数,特征,梯度,下降,正规,theta
From： https://www.cnblogs.com/asandstar/p/16772431.html

关于多重背包
问题描述：有N种物品和一个容量为V的背包，第i件物品最多有Si 件。每件体积是w[i]，价值是v[i]。求解将哪些物品装入背包可使价值总和最大。问题特点：第i件物品......
多重积分合元 - 余面积公式法
该定理由Songby提出.余面积公式\[\iint\limits_Dg(x,y)\textdS=\int_a^b\int\limits_Lg(x,y)\frac{\textdy}{f_x}\textdz\]我们来证明这个定理.画出\(f(x......
继承脸部特征揭开后代的神秘面纱
通过已知任意两张面部图片重新生成新面孔，使得新面部符合已知图像的特征，这在预测亲属或后代的面部场景中有着特殊意义。这当然是一个有趣的问题，图龙解“变脸934”在解决这类......
递归特征金字塔+可切换空洞卷积提升目标检测性能（附框架源码）
“计算机视觉研究院”计算机视觉研究院专栏作者：Edison_G许多现代的目标检测器通过两次look和think的机制表现出优异的性能。今天分享的是在目标检测的主干设计中探讨了这......
VC R-CNN | 无监督的视觉常识特征学习（附源码）
计算机视觉研究院专栏作者：Edison_G最近CVPR不是在线直播，我关注了下，发现一篇很有意思的paper。让我想到在研究生有做过类似的算法——因果关系。今天我们看看这位作者是怎么......
局部人脸识别的动态特征匹配（文末附文章及源码地址）
【导读】该文章被Trans收录。无约束环境下的局部人脸识别(PFR)是一项非常重要的任务，尤其是在视频监控和移动设备等由于遮挡、视野外、大视角等原因容易捕捉到局部人脸图像的......
云原生是什么？细数云原生的5大特征
云原生是什么？细数云原生的5大特征导读：随着公有云和私有云的广泛部署，云计算基础设施成为企业部署新业务的首选。可以说，云计算已进入下半场，各大云计算服务商的......
ES6新特征高阶函数
<!DOCTYPEhtml><htmllang="en"><head> <metacharset="UTF-8"> <metahttp-equiv="X-UA-Compatible"content="IE=edge"> <metaname="viewport"content="......
恶意代码分析实战恶意代码的网络特征 lab14-1 14-2 14-3 都是http c2，并用到了自定义
先反编译看看：函数在做base64加密：验证下想法，果然：后面的功能，就是在下载执行了：我们分析下细节：问题1：使用wireshark进行监控网络特征，运......
css多重背景
background-size（背景尺寸）background-origin（定义背景图像的位置）background-clip（背景的绘制区域）多重背景CSS允许您通过background-image属性为一个元素添加多幅背......

吴恩达机器学习复习2：多重特征、多重变量的梯度下降、梯度下降实践Ⅰ：数据特征缩放、梯度下降实践Ⅱ：学习率、特征和多项式回归、正规方程法、向量化

相关文章

赞助商

阅读排行