首页 > 其他分享 >第二天学习笔记:Datawhale X 李宏毅苹果书 AI夏令营

第二天学习笔记:Datawhale X 李宏毅苹果书 AI夏令营

时间:2024-09-03 22:22:45浏览次数:13  
标签:称为 函数 Sigmoid AI 李宏毅 Datawhale 一个 ReLU 线性

今天学的有些小兴奋,终于解锁了很多熟悉但不明就里的术语。

天呢,原来ReLU是“修正线性单元”的意思!Rectified Linear Unit!

但是呢,也有不大对付的地方:好几个地方前言不搭后语。

容我一一道来。

今天就顺序边读边记

线性模型(linear model)== 把模型输入的特征 x 乘上一个权重,再加上一个偏置就得到预测的结果,这样的模型称为线性模型。

1.2.1 分段线性曲线

Hard Sigmoid (Note:文中这里是第一次提这个英文词组很突兀,就那么生硬的摆在那里了)函数的特性是当输入的值,当 x 轴的值小于某一个阈值(某个定值)的时候,大于另外一个定值阈值的时候,中间有一个斜坡。所以它是先水平的,再斜坡,再水平的。

分段线性曲线(piecewise linear curve)可以看作是一个常数,再加上一堆不同线性函数。如果分段线性曲线越复杂,转折的点越多,所需的不同线性函数就越多。

Sigmoid 函数就是 S 型的函数。因为它长得是有点像 S 型,所以叫它 Sigmoid 函数 

其横轴输入是 x1,输出是 y,c 为常数。 

如果 x1 的值,趋近于无穷大的时候,e−(b+wx1) 这一项就会消失,当 x1 非常大的时候,这一条就会收敛在高度为 c 的地方。如果 x1 负的非常大的时候,分母的地方就会非常大,y的值就会趋近于 0

wij 代表在第 i 个 Sigmoid 里面,乘给第 j 个特征的权重,w 的第一个下标代表是现在在考虑的是第一个 Sigmoid 函数

我们可以用矩阵跟向量相乘的方法,写一个比较简洁的写法。

Sigmoid 的数量是一个超参数。

所有的未知的参数,一律统称 θ。损失函数就变成 L(θ)。

要找到 θ 让损失越小越好,可以让损失最小的一组 θ 称为 θ∗

把 N 笔数据随机分成一个一个的批量(batch),一组一组的

把所有的批量都看过一次,称为一个回合(epoch),每一次更新参数叫做一次更新。

一个回合的训练,更新了几次参数?取决于它的批量大小有多大。

1.2.2 模型变形

HardSigmoid 可以看作是两个修正线性单元(Rectified Linear Unit,ReLU)的加总,ReLU 的图像有一个水平的线,走到某个地方有一个转折的点,变成一个斜坡,其对应的公式为 

(note:☀️老天爷,看到这里激动的我嘎嘎的,已经2年了接触这个概念。一直get不到这么缩写的点儿。今儿终于 得偿所愿了!!! 给作者送花

标签:称为,函数,Sigmoid,AI,李宏毅,Datawhale,一个,ReLU,线性
From: https://blog.csdn.net/V6T1Z4/article/details/141676881

相关文章

  • 第一篇献给Datawhale
    写今天的学习笔记之前,我要好好表达对Datawhale的感谢。记不清这是第几次跟着组织学习了。虽然也只是从懵懂小白0.1到萌萌小白0.2,虽然很多词汇还都不懂,但没有Datawhale的学习氛围和小伙伴的积极表现,我的这一点点进步也可能不会有。正文开始:各种词汇定义:模型(model)== 带有未......
  • 2、实践方法论(Datawhale X 李宏毅苹果书 AI 夏令营)
    2、实践方法论(DatawhaleX李宏毅苹果书AI夏令营)在应用机器学习算法时,实践方法论能够帮助我们更好地训练模型。如果在Kaggle上的结果不太好,虽然Kaggle上呈现的是测试数据的结果,但要先检查训练数据的损失。2.1模型偏差有时候把模型设置的太过简单,使得函数的集合太小了,没......
  • OpenCV与AI深度学习 | 实战 | OpenCV传统方法实现密集圆形分割与计数(详细步骤 + 代码
    本文来源公众号“OpenCV与AI深度学习”,仅用于学术分享,侵权删,干货满满。原文链接:实战|OpenCV传统方法实现密集圆形分割与计数(详细步骤+代码)导 读    本文主要介绍基于OpenCV传统方法实现密集圆形分割与计数应用,并给详细步骤和代码。 背景介绍  实例图片来......
  • Datawhale X 李宏毅苹果书 AI夏令营-深度学习入门班-task3-机器学习实践方法论
    引入在简单了解到机器学习的过程,以及模型函数的优化升级之后,我们需要根据一些方法论,解决模型实践过程中会遇到的问题,学会分析模型数据,按照正确的路径优化模型,减少测试误差(TestingLoss)。实践方法论整体框架下图是实践方法论的整体框架,下文会根据逻辑顺序一一介绍。step......
  • 利用LangChain构建MySQL数据库问答代理
    引言随着自然语言处理技术的飞速发展,尤其是大型语言模型(LLM)的应用日益广泛,人们对于如何更高效地与这些模型交互产生了浓厚的兴趣。LangChain是一个旨在简化与语言模型集成的开源框架,它使得开发者能够轻松地构建出强大的应用程序。本文将介绍如何使用LangChain结合MySQL数据......
  • Datawhale X 李宏毅苹果书 AI夏令营 Task3-机器学习实践方法论
    在上一章介绍完机器学习模型后,我们接着讨论模型中可能存在的一些问题。首先我们需要明确一件事,就是Kaggle上的测试结果不好,可能有多个原因。第一,如果模型在运行训练模型时,所产生的损失就很大,那么有可能是模型偏差(modelbias)或优化(optimization)问题。第二,如果模型在运行训......
  • Datawhale X 李宏毅苹果书 AI夏令营-深度学习入门篇-Task3《深度学习详解》- 实践方法
     核心学习目标:通过《深度学习详解》和李宏毅老师21年的机器学习课程视频,入门机器学习,并尝试学习深度学习,展开代码实践(选修)。该书保留了李宏毅老师公开课中大量生动有趣的例子,帮助读者从生活化的角度理解深度学习的概念、建模过程和核心算法细节,包括卷积神经网络、Transform......
  • 使用docker部署tensorrtllm推理大模型baichuan2-7b
    简介大模型的推理框架,我之前用过vllm和mindie。近期有项目要用tensorrtllm,这里将摸索的过程记录下,特别是遇到的问题。我的环境是Linux+rt3090准备docker环境本次使用docker镜像部署,需要从网上拉取:dockerpullnvcr.io/nvidia/tritonserver:24.08-trtllm-python-py3Th......
  • AI大模型系列之大模型原理科普(深度万字好文)
    天地转,光阴迫。一万年太久,只争朝夕。数字时代,要顺势而为,让我们系统性掌握AI大模型家族的技术本领,成为行业翘楚!今天,我们突然发现,AI可以帮忙生成文字、图片、音频和视频等等内容了,而且让人难以分清背后的创作者到底是人类还是AI。这些AI生成的内容被叫做AIGC,它是AIgenerated......
  • 数据库实验 SQL server sduwh caohai
    问题一:根据E-R图写出关系模式,标注主键和外键 学生关系模式:Student(StudentNum,StudentName,StudentSex,StudentAge,StudentPhone,StudentBrith,Speciality)其中主键为学号StudentNum,没有外键。课程关系模式:Course(Coursenum,CourseName,Credit,Classhour,ClassType)其中主键为......