首页 > 其他分享 >深度学习入门篇Task3#Datawhale X 李宏毅苹果书 AI夏令营

深度学习入门篇Task3#Datawhale X 李宏毅苹果书 AI夏令营

时间:2024-09-03 08:52:31浏览次数:10  
标签:Task3 训练 验证 AI 李宏毅 模型 参数 测试 拟合

第二章 实践方法论

2.1 模型偏差

模型过于简单导致未拟合

  • 重新设计模型

  • 增加特征

2.2 优化问题

梯度下降优化的不够,没找到最优参数

  • 针在海里,大海捞针,但是方法不给力

建议:先使用简单的线性模型或者是SVR测试一下,一般这些模型不会优化不到位

训练数据损失突然不再降低或者变大是优化的问题,如果训练数据损失很小了但是测试数据损失很大就是过拟合

2.3 过拟合

出现的原因:模型的灵活性很强,所以根据训练集可能拟合出了很复杂的函数,但是测试集的输出就和之前的真实值偏差很大了

解决

  • 增加训练集

    • 使用数据增强等手段,可以把函数控制住
  • 给模型一些限制,让模型不要有过大的灵活性

    • 给模型比较少的参数

    • 用比较少的特征

    • 早停(early stopping)、正则化(regularization)和丢弃法(dropoutmethod)

2.4 交叉验证

三折交叉验证为例

  • 首先划分成训练集,公开测试集(验证集)和私人测试集,选择在验证集每轮结果平均后的参数作为最优参数集,然后在训练集和验证集上最后训练整体模型,在私人测试集上进行测试,就可以得到比较客观的评价结果。

2.5 不匹配

数据的分布不同

  • 例如:往期的周五观看人数都很少,但是测试的时候周五人突然多了。这说明训练和测试的数据分布不同

  • 再比如:用2020年训练,用2021预测,根本预测不准

标签:Task3,训练,验证,AI,李宏毅,模型,参数,测试,拟合
From: https://www.cnblogs.com/bravelyj/p/18393860

相关文章

  • Typora 适配高版本 Mermaid
    Typora适配高版本Mermaid查看Mermaid版本info下载最新的mermaid.min.js文件在搜索框输入CDNhttps://cdn.jsdelivr.net/npm/mermaid@11/替换Typora的window.html文件<script> constinterval=setInterval(()=>{ console.log('checkmermaid...'); if......
  • 科普文:软件架构Elasticsearch系列之【2024年8月30日 Shay:Elasticsearch is Open Sourc
     2021年1月,当时Elastic公司决定把Elasticsearch和Kibana的许可证从Apache2.0变更为ElasticLicense2.0(ELv2)和ServerSidePublicLicense(SSPL)双许可。尽管这两个许可证也允许源代码公开,但它们并不符合开源倡议组织(OSI)的开源定义。应对质疑:“本就是一个错误,现......
  • 使用kamailio进行分机注册及互拨
    操作系统版本:Debian12.5_x64kamailio版本:5.8.2kamailio作为专业的SIP服务器,可承担注册服务器的角色。今天记录下kamailio作为注册服务器,承接分机注册,并实现相互拨打的过程。我将从以下几个方面展开:模块配置分机账号添加无rtp代理的分机互拨带rtp代理的分机互拨配套资源......
  • Fire Again
    2024.9.2还是写几句吧。今天被T1卡了很久呢。明明用简明的做法过掉了大部分数据,却没有怀疑cornercase的判断,而是转而怀疑做法本身,甚至double精度的问题。这是一个比较奇怪的决策。导致了10:30才通过掉。T2是一个简明的矩阵快速幂优化DP。但是根本没有任何思考地,写出......
  • 【Intel Hackathon大赛】基于OpenVINO™ Model Optimizer + ChatGLM-6B + P-Tuning的A
    随着人工智能技术的飞速发展,自然语言处理(NLP)领域迎来了前所未有的变革,而大语言模型(LargeLanguageModel,LLM)作为这一变革的核心驱动力,正逐步成为连接人类语言与机器智能的桥梁。LLM通过海量文本数据的学习,掌握了丰富的语言知识、上下文理解能力以及生成高质量文本的能力,为智能教......
  • LangChain入门指南,轻松学习,助你游刃有余
    一、前言像OpenAI的GPT-4这样的大型语言模型(LLM)已经风靡全球。它们可以自动执行各种任务,如回答问题、翻译语言、分析文本等等。LLM是第一种真正让人感觉像是“人工智能”的机器学习类型。然而,在实际产品中应用LLM仍存在挑战。特别是LLM管理,这是其中最棘手和繁琐的挑战之......
  • LinkAI工作流发布至广场,并通过api调用自己或者他人的工作流
    什么是工作流LinkAI工作流(WorkFlow)是一种灵活的智能体搭建方式。可以自由选择「大模型、应用、知识库、插件、意图识别、转人工、渠道消息发送」等多种原子能力,通过可视化拖拉拽的方式进行组合编排,零代码搭出一个业务流程。让智能体按照规划的方式进行工作。并且可以设置定时运行......
  • 【ACM独立出版, CCF主办】2024智能物联与计算国际学术会议(AITC 2024,11月1-11月3)
    为探讨智能物联与计算技术所涉领域的最新研究和发展趋势,2024智能物联与计算学术大会(AITC2024)将于2024年11月1日-11月3日在中国·杭州举行。AITC2024由中国计算机学会、中国人工智能学会、浙江省科学技术协会、浙江工业大学、浙江省人工智能产业技术联盟主办,由中国计......
  • 机器学习AI夏令营Task3:深度学习详解
    目录 实践方法论1.模型偏差模型偏差的示例说明代码解释2.优化问题优化问题的基本组成部分优化算法梯度下降算法示例 3.过拟合4.交叉验证5.不匹配 实践方法论    深度学习的实践是一种系统化的过程,它涉及从数据收集与预处理开始,通过构建合适的神经网络......
  • 用 AI 定制龙年红包封面保姆级教程
    作者:苍何,前大厂高级Java工程师,阿里云专家博主,2023年实力新星,土木转码,现任部门技术leader,专注于互联网技术分享,职场经验分享。大家好,我是苍何。这两天很多公众号给大家送了不少红包封面,像我有6000个,分三批,第一批我先用AI制作了个封面,并已经审核通过,2000个全部免费赠送给......