首页 > 其他分享 >Datawhale X 李宏毅苹果书 AI夏令营 Task2笔记

Datawhale X 李宏毅苹果书 AI夏令营 Task2笔记

时间:2024-08-31 21:53:36浏览次数:14  
标签:Task2 训练 AI 李宏毅 RMSProp 学习 参数 Adam 梯度

Task2.1:《深度学习详解》- 3.3&4&5 自适应学习率的概念和方法,包括AdaGrad、RMSProp和Adam等优化器。

- **训练网络时的梯度和损失变化**:训练网络时损失可能不再下降,但梯度范数不一定小,梯度可能在山谷壁间“震荡”,多数训练未到临界点就停止。
- **不同学习率的影响**:学习率过大或过小都会影响训练效果,过大步伐大无法滑到谷底,过小则难以靠近局部最小值。
- **自适应学习率方法**:包括AdaGrad能根每个参数的梯度大小自动调整学习率;RMSProp可动态调整同一参数不同时间的学习率;Adam是RMSprop加上动量,能自适应调整学习率。

- **AdaGrad**: 根据每个参数的梯度大小自动调整学习率,使得在梯度大时学习率减小,在梯度小时学习率增大。

- **RMSProp**: 同一个参数需要的学习率,也会随着时间而改变。通过引入超参数α来调整当前梯度与之前梯度的权重,实现学习率的动态调整。

- **Adam优化器**: 是RMSProp加上动量的方法,能够同时考虑参数更新的方向和大小,实现更有效的训练。

- **学习率调度**:通过让学习率与时间相关,采用学习率衰减策略,可解决训练中出现的问题,使训练更顺利地达到终点。

 

 

神经网络训练不起来怎么办(4):损失函数(Loss)也可能有影响_思维导图:

标签:Task2,训练,AI,李宏毅,RMSProp,学习,参数,Adam,梯度
From: https://www.cnblogs.com/LYLtim/p/18387675

相关文章

  • Datawhale X 李宏毅苹果书 AI夏令营-深度学习入门班-task1-初步了解机器学习
    机器学习概念就是使计算机模拟人类的学习过程,通过分析大量数据,完成任务,处理问题。这个过程简单来说就是,使计算机寻找到一个函数,构建起一个模型,通过数据使模型准确化,便于输出目标结果。机器学习类型机器学习根据其所需完成的任务不同,需要寻找不同类型的函数。类型一:回归(Regr......
  • AI产品经理薪资揭秘:起薪30k不是梦!零基础转行攻略大公开
    2024年,还有什么新风口?AI、元宇宙、NFT…很多人不知道,其实不管是元宇宙还是NFT,它们本质上就是人工智能领域。AI自身应用领域非常广泛,大批高薪岗位随之涌了出来,包括AI产品经理。AI产品经历具体工作内容是什么?薪资有多香?普通人如何进入AI人工智能行业?需要写代码吗?别急,小......
  • 运维系列&AI系列&Lenovo-G双系统系列(前传-装之前搜索的):ubuntu正确安装显卡驱动的姿势
    ubuntu正确安装显卡驱动的姿势ubuntu正确安装显卡驱动的姿势1.ubuntu16.04默认安装了第三方开源的驱动程序nouveau,安装nvidia显卡驱动首先需要禁用nouveau,不然会碰到冲突的问题,导致无法安装nvidia显卡驱动。2.在英伟达的官网上查找你自己电脑的显卡型号然后下载相应的......
  • AI编码新时代:免费人工智能助手Blackbox AI
    前言:在当今快速发展的科技时代,人工智能已经渗透到我们生活的方方面面,从智能手机的语音助手到智能家居控制系统,再到在线客服和个性化推荐算法,AI智能工具正变得越来越普遍。它们以其高效、智能和用户友好的特性,极大地提升了我们的生活和工作效率。作为一个热衷于尝试各种......
  • 35岁危机解密:AI产品经理如何突破职场天花板
    01被裁的35岁朋友去年,一家知名公司大裁员,很多35岁的非高管员工被牵连,包括我的一位朋友。我第一时间联系了他,看看有没有能够帮上忙的地方。我:传闻XX公司要收购你们?朋友:是的。我要失业了。我:咱有技术,不缺一份工作。不行咱就去杭州和上海。朋友:年纪大了,比较尴尬。再......
  • 6个岗位抢1个人,百万年薪抢毕业生?大厂打响AI人才战
    “24岁毕业时年薪50万元,到了30岁大概能升到P7(注:职级名称),那时就能年薪百万了。”从上海交大硕士毕业后,出生于2000年的赵宏在今年入职腾讯,担任AI算法工程师,成为AI风口下第一批就业的年轻人。伴随人工智能(AI)日渐火热,“百模大战”激烈开打,AI人才掀起招聘热潮。求职招聘平台猎......
  • 3D DRAM集成AI能力,卷出新高度!
    数据中心在追求更高性能和更低总拥有成本(TCO)的过程中面临三大主要内存挑战。首先,当前服务器内存层次结构存在局限性。直接连接的DRAM与固态硬盘(SSD)存储之间存在三个数量级的延迟差异。当处理器直接连接的内存容量耗尽时,就必须转向SSD,导致处理器处于等待状态。这种等待,即延......
  • Mr.Lou的面向AI课程学习之_markdown
    面向AI学习markdown的使用提问词作为计算机技术专家、人工智能技术专家,网络空间安全专家,密码学专家,密码技术专家,请您:深入浅出的讲解一下Mardown,Markdown的详细语法推荐至少两款线上工具,至少两种线下工具讲解Markdown的高级用法,包括插入数学公式、绘图、制作PPT,格式转换等讲......
  • AI工具
    AI平台我知道的AI大模型平台有百度的文心一言、openai的chatgpt、阿里云的ai工具、夸克的夸克AI等,其中我使用过文心一言和chatgptAI帮助AI提供的帮助:(1)写作辅导:写文章的时候会用AI进行一些润色的工作,并检查是否有语法问题(2)问题解答:在复习的时候,有时候没办法查到答案的解析,会使......
  • 0.AI工具
    AI工具一、你知道或使用过什么AI大模型平台?明镜AIKimi文心一言OpenAI二、如果有AI大模型平台助力学习的经历,举例说明AI如何提升你的学习效率的?例子越多越好。论文修改:当我撰写论文时,AI可以帮我检查语法错误,提供表述上的修改建议,甚至给出如何改进论点的反馈意见。疑问解......