Datawhale X 李宏毅苹果书 AI夏令营-跟李宏毅学深度学习(入门)Task3笔记

时间：2024-09-01 20:52:57浏览次数：17

标签：误差 Task3 函数训练验证 AI 李宏毅模型拟合

一、机器学习框架&实践攻略

1. 总览

一、机器学习框架&实践攻略

1. 总览

2. 训练误差较大时：

1.模型偏差

模型偏差可能会影响模型训练。举个例子，假设模型过于简单，一个有未知参数的函数代θ1 得到一个函数 fθ1(x)，同理可得到另一个函数 fθ2(x)，把所有的函数集合起来得到一个函数的集合。但是该函数的集合太小了，没有包含任何一个函数，可以让损失变低的函数不在模型可以描述的范围内。在这种情况下，就算找出了一个 θ∗，虽然它是这些蓝色的函数里面最好的一个，但损失还是不够低。这种情况就是想要在大海里面捞针（一个损失低的函数），结果针根本就不在海里。

可以通过给模型更大的灵活性来克服模型偏差。例如引入更多的参数来使模型更好地学习。一个建议判断模型灵活性的方法，通过比较不同的模型来判断模型现在到底够不够大。

2. 优化问题

一般只会用到梯度下降进行优化，这种优化的方法很多的问题。比如可能会卡在局部最小值的地方，无法找到一个真的可以让损失很低的参数。这就需要去优化损失函数。

3.训练误差较小时：

1.测试误差较小：

找到了较好的模型，任务已经结束。

2.测试误差较大：

1.过拟合

为什么会有过拟合这样的情况呢？举一个极端的例子，这是训练集。假设根据这些训练集，某一个很废的机器学习的方法找出了一个一无是处的函数。这个一无是处的函数，只要输入 x 有出现在训练集里面，就把它对应的 y 当做输出。如果 x 没有出现在训练集里面，就输出一个随机的值。这个函数啥事也没有干，其是一个一无是处的函数，但它在训练数据上的损失是 0。把训练数据通通丢进这个函数里面，它的输出跟训练集的标签是一模一样的，所以在训练数据上面，这个函数的损失可是 0 呢，可是在测试数据上面，它的损失会变得很大，因为它其实什么都没有预测，这是一个比较极端的例子，在一般的情况下，也有可能发生类似的事情。

如果模型灵活性很大，则模型可以变成各式各样的函数，没有给它数据做为训练，可以产生各式各样奇怪的结果。因此可以通过对模型加一些限制来避免过拟合问题。

限制的一些方法：

给模型比较少的参数，用比较少的特征，早停（early stopping）、正则化（regularization）和丢弃法（dropoutmethod）。

但也不要给太多的限制，当限制太多时可能使模型性能下降，使其在训练集上的误差就快速增大。

合理选择模型的方法：

把训练的数据分成两半，一部分称为训练集（training set），一部分是验证集（validation set）

如果随机分验证集，可能会分得不好，分到很奇怪的验证集，会导致结果很差，如果有这个担心的话，可以用 k 折交叉验证（k-foldcross validation），如图所示。k 折交叉验证就是先把训练集切成 k 等份。在这个例子，训练集被切成 3 等份，切完以后，拿其中一份当作验证集，另外两份当训练集，这件事情要重复 3 次。即第一份第 2 份当训练，第 3 份当验证；第一份第 3 份当训练，第 2 份当验证；第一份当验证，第 2 份第 3 份当训练。

2.不匹配

模型预测的与实际结果截然相反，这就叫做不匹配。不匹配与过拟合不同，过拟合可以通过搜集更多数据来解决，但是不匹配是指训练集与测试集的分布不同，增加数据也不能让模型做得更好，所以这种问题要怎么解决，匹不匹配要看对数据本身的理解了，我们可能要对训练集跟测试集的产生方式有一些理解，才能判断它是不是遇到了不匹配的情况。

下图中2月26这个点就属于不匹配问题。

标签：误差,Task3,函数,训练,验证,AI,李宏毅,模型,拟合
From： https://blog.csdn.net/Hh2767474144/article/details/141789263

来了，HelpLook接入GPT4o-mini，OpenAI大动作！如何巧妙运用AI新功能？
上月，OpenAI推出了其最新人工智能模型——GPT-4oMini。作为当前较为实用的小型模型，GPT-4oMini旨在大幅拓展AI应用领域，同时显著降低开发成本。每百万输入tokens仅需15美分，输出tokens为60美分，远低于先前的GPT-3.5Turbo。HelpLook率先接入GPT-4oMini大模型，为大家带来福利。......
7 个热门的 AI 视频生成工具介绍
AI视频生成领域最近的发展简直是突飞猛进，让人目不暇接啊！就在前不久，OpenAI推出的Sora震惊了整个科技圈。但是，惊喜不止于此，国产的AI视频工具“可灵”据说已经在某些方面超越了Sora，这真是让人兴奋不已！ AI视频生成技术的发展速度之快，应用范围之广，真的让人感叹。从内......
Datawhale X 李宏毅苹果书 AI夏令营深度学习入门笔记02
目录一、学习资料二、学习笔记（一）线性模型1、考虑周期性2、修改模型（二）模型变形之分段线性曲线1、分段线性直线2、分段线性曲线的图像和表达式（机器学习第一步：写出带有未知数的函数）（1）如何构成（2）如何表达（3）如何改进3、分段线性曲线的损失（机器学习第二步：定义损失）4、分段......
Datawhale X 李宏毅苹果书 AI夏令营深度学习进阶笔记02
目录一、学习资料二、学习笔记（一）自适应学习率（adaptivelearningrate）1、什么是+为什么要用2、三种自适应学习率方法（1）AdaGrad（AdaptiveGradient）（2）RMSprop（RootMeanSquaredpropagation）（3）Adam（Adaptivemomentestimation）（二）学习率调度（learningratescheduling）1、为什么......
河道AI智能视频分析识别系统
河道AI智能视频分析识别系统智能检测方式，智能检测分析河道两边意外违反规定问题，确保人民人身安全问题，河道AI智能视频分析识别系统在初期处理伤害安全性的问题，保证水环境生态安全和人民生命安全安全性，使人和水的影响做到和睦情况，使不足的水源为社会经济的协调发展作为长期性适用，为......
面完阿里 AIGC 大模型算法岗，心态崩了。。。
最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是，当前职场环境已不再是那个双向奔赴时代了。求职者在变多，HC在变少，岗位要求还更高了。最近，我们又陆续整理了很多大厂的面试题，帮助一些球友解惑答疑，分享技术面试中的那些弯弯绕绕。合集：《大模型面试宝......
人工智能100个AI术语
你好，我是三桥君人工智能（AI）技术的快速发展正深刻地改变着我们的世界。作为产品经理，深入了解并掌握AI的最新动态与技术是保持竞争力的关键。然而，对于多数人而言，涉猎专业的AI知识并非易事。鉴于此，我萌生了推动这一学习过程的想法。为此，三桥君整理了一套包含100个AI术语的资料......
《“草莓”引领风潮：全能AI与专业型AI的未来市场较量》
......
Luma AI，让你的视频像电影一样精彩！附带使用教程
Luma视频生成API对接说明随着AI的应用变广，各类AI程序已逐渐普及。AI已逐渐深入到人们的工作生活方方面面。而AI涉及的行业也越来越多，从最初的写作，到医疗教育，再到现在的视频。Luma是一个专业高质量的视频生成平台，用户只需上传素材，即可根据不同风格和效果自动生......

Datawhale X 李宏毅苹果书 AI夏令营-跟李宏毅学深度学习(入门)Task3笔记

一、机器学习框架&实践攻略

1. 总览

2. 训练误差较大时：

1.模型偏差

2. 优化问题

3.训练误差较小时：

1.测试误差较小：

2.测试误差较大：

1.过拟合

2.不匹配

相关文章

赞助商

阅读排行