2、实践方法论（Datawhale X 李宏毅苹果书 AI 夏令营）

在应用机器学习算法时，实践方法论能够帮助我们更好地训练模型。如果在 Kaggle 上的结果不太好，虽然 Kaggle 上呈现的是测试数据的结果，但要先检查训练数据的损失。

2.1 模型偏差

有时候把模型设置的太过简单，使得函数的集合太小了，没有包含任何一个函数，可以让损失变低的函数不在模型可以描述的范围内。可以重新设计一个模型，给模型更大的灵活性。

2.2优化问题

一般只会用到梯度下降进行优化，这种优化的方法很多的问题。比如可能会卡在局部最小值的地方，无法找到一个真的可以让损失很低的参数。1.可以通过比较不同的模型来判断模型现在到底够不够大。2.看到一个从来没有做过的问题，可以先跑一些比较小的、比较浅的网络，或甚至用一些非深度学习的方法。接着用深的模型，如果深的模型跟浅的模型比起来，深的模型明明灵活性比较大，但损失却没有办法比浅的模型压得更低代表说优化有问题，梯度下降不给力。如果训练数据上面的损失小，测试数据上的损失大，可能是真的过拟合。在测试上的结果不好，不一定是过拟合。要把训练数据损失记下来，先确定优化没有问题，模型够大了。接下来才看看是不是测试的问题，如果是训练损失小，测试损失大，这个有可能是过拟合。

2.3过拟合

解决办法：1、增加训练集。2、给模型增加一些限制，但不要给出太多的限制。模型的复杂程度，或这样让模型的灵活性越来越大。但复杂的程度和灵活性都没有给明确的定义。比较复杂的模型包含的函数比较多，参数比较多。所以通过测试得到中庸的模型，使得训练集的损失度最低。

2.4交叉验证

比较合理选择模型的方法是把训练的数据分成两半，一部分称为训练集（training set），一部分是验证集（validation set）。最好的做法，就是用验证损失，最小的直接挑就好了，不要管公开测试集的结果。在实现上，不太可能这么做，因为公开数据集的结果对模型的选择，可能还是会有些影响的。理想上就用验证集挑就好，有过比较好的基线（baseline）算法以后，就不要再去动它了，就可以避免在测试集上面过拟合。

2.5不匹配

不匹配与过拟合不同，过你和可以通过搜集更多的数据来克服，但是不匹配值得是训练集和测试集的分布不同，训练集再增加已经没有帮助。

标签：训练,AI,李宏毅,模型,损失,Datawhale,测试,拟合,比较
From： https://www.cnblogs.com/bxzl/p/18395541

OpenCV与AI深度学习 | 实战 | OpenCV传统方法实现密集圆形分割与计数(详细步骤 + 代码
本文来源公众号“OpenCV与AI深度学习”，仅用于学术分享，侵权删，干货满满。原文链接：实战|OpenCV传统方法实现密集圆形分割与计数(详细步骤+代码)导读本文主要介绍基于OpenCV传统方法实现密集圆形分割与计数应用，并给详细步骤和代码。背景介绍实例图片来......
Datawhale X 李宏毅苹果书 AI夏令营-深度学习入门班-task3-机器学习实践方法论
引入在简单了解到机器学习的过程，以及模型函数的优化升级之后，我们需要根据一些方法论，解决模型实践过程中会遇到的问题，学会分析模型数据，按照正确的路径优化模型，减少测试误差（TestingLoss）。实践方法论整体框架下图是实践方法论的整体框架，下文会根据逻辑顺序一一介绍。step......
利用LangChain构建MySQL数据库问答代理
引言随着自然语言处理技术的飞速发展，尤其是大型语言模型（LLM）的应用日益广泛，人们对于如何更高效地与这些模型交互产生了浓厚的兴趣。LangChain是一个旨在简化与语言模型集成的开源框架，它使得开发者能够轻松地构建出强大的应用程序。本文将介绍如何使用LangChain结合MySQL数据......
Datawhale X 李宏毅苹果书 AI夏令营 Task3-机器学习实践方法论
在上一章介绍完机器学习模型后，我们接着讨论模型中可能存在的一些问题。首先我们需要明确一件事，就是Kaggle上的测试结果不好，可能有多个原因。第一，如果模型在运行训练模型时，所产生的损失就很大，那么有可能是模型偏差(modelbias)或优化(optimization)问题。第二，如果模型在运行训......
Datawhale X 李宏毅苹果书 AI夏令营-深度学习入门篇-Task3《深度学习详解》- 实践方法
核心学习目标：通过《深度学习详解》和李宏毅老师21年的机器学习课程视频，入门机器学习，并尝试学习深度学习，展开代码实践（选修）。该书保留了李宏毅老师公开课中大量生动有趣的例子，帮助读者从生活化的角度理解深度学习的概念、建模过程和核心算法细节，包括卷积神经网络、Transform......
使用docker部署tensorrtllm推理大模型baichuan2-7b
简介大模型的推理框架，我之前用过vllm和mindie。近期有项目要用tensorrtllm，这里将摸索的过程记录下，特别是遇到的问题。我的环境是Linux+rt3090准备docker环境本次使用docker镜像部署，需要从网上拉取：dockerpullnvcr.io/nvidia/tritonserver:24.08-trtllm-python-py3Th......
AI大模型系列之大模型原理科普（深度万字好文）
天地转，光阴迫。一万年太久，只争朝夕。数字时代，要顺势而为，让我们系统性掌握AI大模型家族的技术本领，成为行业翘楚！今天，我们突然发现，AI可以帮忙生成文字、图片、音频和视频等等内容了，而且让人难以分清背后的创作者到底是人类还是AI。这些AI生成的内容被叫做AIGC，它是AIgenerated......
数据库实验 SQL server sduwh caohai
问题一：根据E-R图写出关系模式，标注主键和外键学生关系模式：Student（StudentNum，StudentName，StudentSex,StudentAge,StudentPhone,StudentBrith，Speciality）其中主键为学号StudentNum，没有外键。课程关系模式：Course（Coursenum,CourseName,Credit,Classhour,ClassType）其中主键为......
使用LangChain加载Project Gutenberg电子书：实用指南
使用LangChain加载ProjectGutenberg电子书：实用指南引言ProjectGutenberg是一个提供免费电子书的在线图书馆，拥有超过60,000本电子书。对于自然语言处理（NLP）和文本分析项目来说，这是一个宝贵的资源。本文将介绍如何使用LangChain的GutenbergLoader来加载ProjectGutenberg的......
使用LangChain与OctoAI集成:构建强大的AI应用
使用LangChain与OctoAI集成:构建强大的AI应用引言在当今快速发展的AI领域,如何高效地利用大型语言模型(LLM)构建应用已成为开发者面临的重要挑战。本文将介绍如何使用LangChain框架与OctoAI服务相结合,轻松构建强大的AI应用。我们将深入探讨OctoAI的特性,以及如何通过Lang......

2、实践方法论（Datawhale X 李宏毅苹果书 AI 夏令营）

2、实践方法论（Datawhale X 李宏毅苹果书 AI 夏令营）

2.1 模型偏差

2.2优化问题

2.3过拟合

2.4交叉验证

2.5不匹配

相关文章

赞助商

阅读排行