深度学习入门篇Task3#Datawhale X 李宏毅苹果书 AI夏令营

时间：2024-09-03 08:52:31浏览次数：15

标签：Task3 训练验证 AI 李宏毅模型参数测试拟合

第二章实践方法论

2.1 模型偏差

模型过于简单导致未拟合

重新设计模型
增加特征

2.2 优化问题

梯度下降优化的不够，没找到最优参数

针在海里，大海捞针，但是方法不给力

建议：先使用简单的线性模型或者是SVR测试一下，一般这些模型不会优化不到位

训练数据损失突然不再降低或者变大是优化的问题，如果训练数据损失很小了但是测试数据损失很大就是过拟合

2.3 过拟合

出现的原因：模型的灵活性很强，所以根据训练集可能拟合出了很复杂的函数，但是测试集的输出就和之前的真实值偏差很大了

解决

增加训练集
- 使用数据增强等手段，可以把函数控制住
给模型一些限制，让模型不要有过大的灵活性
- 给模型比较少的参数
- 用比较少的特征
- 早停（early stopping）、正则化（regularization）和丢弃法（dropoutmethod）

2.4 交叉验证

三折交叉验证为例

首先划分成训练集，公开测试集（验证集）和私人测试集，选择在验证集每轮结果平均后的参数作为最优参数集，然后在训练集和验证集上最后训练整体模型，在私人测试集上进行测试，就可以得到比较客观的评价结果。

2.5 不匹配

数据的分布不同

例如：往期的周五观看人数都很少，但是测试的时候周五人突然多了。这说明训练和测试的数据分布不同
再比如：用2020年训练，用2021预测，根本预测不准

标签：Task3,训练,验证,AI,李宏毅,模型,参数,测试,拟合
From： https://www.cnblogs.com/bravelyj/p/18393860

Typora 适配高版本 Mermaid
Typora适配高版本Mermaid查看Mermaid版本info下载最新的mermaid.min.js文件在搜索框输入CDNhttps://cdn.jsdelivr.net/npm/mermaid@11/替换Typora的window.html文件<script> constinterval=setInterval(()=>{ console.log('checkmermaid...'); if......
科普文：软件架构Elasticsearch系列之【2024年8月30日 Shay：Elasticsearch is Open Sourc
2021年1月，当时Elastic公司决定把Elasticsearch和Kibana的许可证从Apache2.0变更为ElasticLicense2.0（ELv2）和ServerSidePublicLicense（SSPL）双许可。尽管这两个许可证也允许源代码公开，但它们并不符合开源倡议组织（OSI）的开源定义。应对质疑：“本就是一个错误，现......
使用kamailio进行分机注册及互拨
操作系统版本：Debian12.5_x64kamailio版本：5.8.2kamailio作为专业的SIP服务器，可承担注册服务器的角色。今天记录下kamailio作为注册服务器，承接分机注册，并实现相互拨打的过程。我将从以下几个方面展开：模块配置分机账号添加无rtp代理的分机互拨带rtp代理的分机互拨配套资源......
【Intel Hackathon大赛】基于OpenVINO™ Model Optimizer + ChatGLM-6B + P-Tuning的A
随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革，而大语言模型（LargeLanguageModel,LLM）作为这一变革的核心驱动力，正逐步成为连接人类语言与机器智能的桥梁。LLM通过海量文本数据的学习，掌握了丰富的语言知识、上下文理解能力以及生成高质量文本的能力，为智能教......
LangChain入门指南，轻松学习，助你游刃有余
一、前言像OpenAI的GPT-4这样的大型语言模型（LLM）已经风靡全球。它们可以自动执行各种任务，如回答问题、翻译语言、分析文本等等。LLM是第一种真正让人感觉像是“人工智能”的机器学习类型。然而，在实际产品中应用LLM仍存在挑战。特别是LLM管理，这是其中最棘手和繁琐的挑战之......
LinkAI工作流发布至广场，并通过api调用自己或者他人的工作流
什么是工作流LinkAI工作流（WorkFlow）是一种灵活的智能体搭建方式。可以自由选择「大模型、应用、知识库、插件、意图识别、转人工、渠道消息发送」等多种原子能力，通过可视化拖拉拽的方式进行组合编排，零代码搭出一个业务流程。让智能体按照规划的方式进行工作。并且可以设置定时运行......
【ACM独立出版, CCF主办】2024智能物联与计算国际学术会议（AITC 2024，11月1-11月3）
为探讨智能物联与计算技术所涉领域的最新研究和发展趋势，2024智能物联与计算学术大会（AITC2024）将于2024年11月1日-11月3日在中国·杭州举行。AITC2024由中国计算机学会、中国人工智能学会、浙江省科学技术协会、浙江工业大学、浙江省人工智能产业技术联盟主办，由中国计......
机器学习AI夏令营Task3：深度学习详解
目录实践方法论1.模型偏差模型偏差的示例说明代码解释2.优化问题优化问题的基本组成部分优化算法梯度下降算法示例 3.过拟合4.交叉验证5.不匹配实践方法论深度学习的实践是一种系统化的过程，它涉及从数据收集与预处理开始，通过构建合适的神经网络......
用 AI 定制龙年红包封面保姆级教程
作者：苍何，前大厂高级Java工程师，阿里云专家博主，2023年实力新星，土木转码，现任部门技术leader，专注于互联网技术分享，职场经验分享。大家好，我是苍何。这两天很多公众号给大家送了不少红包封面，像我有6000个，分三批，第一批我先用AI制作了个封面，并已经审核通过，2000个全部免费赠送给......

深度学习入门篇Task3#Datawhale X 李宏毅苹果书 AI夏令营

第二章实践方法论

2.1 模型偏差

模型过于简单导致未拟合

2.2 优化问题

梯度下降优化的不够，没找到最优参数

建议：先使用简单的线性模型或者是SVR测试一下，一般这些模型不会优化不到位

训练数据损失突然不再降低或者变大是优化的问题，如果训练数据损失很小了但是测试数据损失很大就是过拟合

2.3 过拟合

出现的原因：模型的灵活性很强，所以根据训练集可能拟合出了很复杂的函数，但是测试集的输出就和之前的真实值偏差很大了

解决

2.4 交叉验证

三折交叉验证为例

2.5 不匹配

数据的分布不同

相关文章

赞助商

阅读排行

深度学习入门篇Task3#Datawhale X 李宏毅苹果书 AI夏令营

第二章 实践方法论

2.1 模型偏差

模型过于简单导致未拟合

2.2 优化问题

梯度下降优化的不够，没找到最优参数

建议：先使用简单的线性模型或者是SVR测试一下，一般这些模型不会优化不到位

训练数据损失突然不再降低或者变大是优化的问题，如果训练数据损失很小了但是测试数据损失很大就是过拟合

2.3 过拟合

出现的原因：模型的灵活性很强，所以根据训练集可能拟合出了很复杂的函数，但是测试集的输出就和之前的真实值偏差很大了

解决

2.4 交叉验证

三折交叉验证为例

2.5 不匹配

数据的分布不同

相关文章

赞助商

阅读排行

第二章实践方法论