第二天学习笔记：Datawhale X 李宏毅苹果书 AI夏令营

时间：2024-09-03 22:22:45浏览次数：13

标签：称为函数 Sigmoid AI 李宏毅 Datawhale 一个 ReLU 线性

今天学的有些小兴奋，终于解锁了很多熟悉但不明就里的术语。

天呢，原来ReLU是“修正线性单元”的意思！Rectified Linear Unit！

但是呢，也有不大对付的地方：好几个地方前言不搭后语。

容我一一道来。

今天就顺序边读边记：

线性模型（linear model）== 把模型输入的特征 x 乘上一个权重，再加上一个偏置就得到预测的结果，这样的模型称为线性模型。

1.2.1 分段线性曲线

Hard Sigmoid （Note：文中这里是第一次提这个英文词组很突兀，就那么生硬的摆在那里了）函数的特性是当输入的值，当 x 轴的值小于某一个阈值（某个定值）的时候，大于另外一个定值阈值的时候，中间有一个斜坡。所以它是先水平的，再斜坡，再水平的。

分段线性曲线（piecewise linear curve）可以看作是一个常数，再加上一堆不同线性函数。如果分段线性曲线越复杂，转折的点越多，所需的不同线性函数就越多。

Sigmoid 函数就是 S 型的函数。因为它长得是有点像 S 型，所以叫它 Sigmoid 函数

其横轴输入是 x1，输出是 y，c 为常数。

如果 x1 的值，趋近于无穷大的时候，e−(b+wx1) 这一项就会消失，当 x1 非常大的时候，这一条就会收敛在高度为 c 的地方。如果 x1 负的非常大的时候，分母的地方就会非常大，y的值就会趋近于 0

wij 代表在第 i 个 Sigmoid 里面，乘给第 j 个特征的权重，w 的第一个下标代表是现在在考虑的是第一个 Sigmoid 函数

我们可以用矩阵跟向量相乘的方法，写一个比较简洁的写法。

Sigmoid 的数量是一个超参数。

所有的未知的参数，一律统称 θ。损失函数就变成 L(θ)。

要找到 θ 让损失越小越好，可以让损失最小的一组 θ 称为 θ∗

把 N 笔数据随机分成一个一个的批量（batch），一组一组的

把所有的批量都看过一次，称为一个回合（epoch），每一次更新参数叫做一次更新。

一个回合的训练，更新了几次参数？取决于它的批量大小有多大。

1.2.2 模型变形

HardSigmoid 可以看作是两个修正线性单元（Rectified Linear Unit，ReLU）的加总，ReLU 的图像有一个水平的线，走到某个地方有一个转折的点，变成一个斜坡，其对应的公式为

（note：☀️老天爷，看到这里激动的我嘎嘎的，已经2年了接触这个概念。一直get不到这么缩写的点儿。今儿终于得偿所愿了！！！给作者送花

标签：称为,函数,Sigmoid,AI,李宏毅,Datawhale,一个,ReLU,线性
From： https://blog.csdn.net/V6T1Z4/article/details/141676881

第一篇献给Datawhale
写今天的学习笔记之前，我要好好表达对Datawhale的感谢。记不清这是第几次跟着组织学习了。虽然也只是从懵懂小白0.1到萌萌小白0.2，虽然很多词汇还都不懂，但没有Datawhale的学习氛围和小伙伴的积极表现，我的这一点点进步也可能不会有。正文开始：各种词汇定义：模型（model）== 带有未......
2、实践方法论（Datawhale X 李宏毅苹果书 AI 夏令营）
2、实践方法论（DatawhaleX李宏毅苹果书AI夏令营）在应用机器学习算法时，实践方法论能够帮助我们更好地训练模型。如果在Kaggle上的结果不太好，虽然Kaggle上呈现的是测试数据的结果，但要先检查训练数据的损失。2.1模型偏差有时候把模型设置的太过简单，使得函数的集合太小了，没......
OpenCV与AI深度学习 | 实战 | OpenCV传统方法实现密集圆形分割与计数(详细步骤 + 代码
本文来源公众号“OpenCV与AI深度学习”，仅用于学术分享，侵权删，干货满满。原文链接：实战|OpenCV传统方法实现密集圆形分割与计数(详细步骤+代码)导读本文主要介绍基于OpenCV传统方法实现密集圆形分割与计数应用，并给详细步骤和代码。背景介绍实例图片来......
Datawhale X 李宏毅苹果书 AI夏令营-深度学习入门班-task3-机器学习实践方法论
引入在简单了解到机器学习的过程，以及模型函数的优化升级之后，我们需要根据一些方法论，解决模型实践过程中会遇到的问题，学会分析模型数据，按照正确的路径优化模型，减少测试误差（TestingLoss）。实践方法论整体框架下图是实践方法论的整体框架，下文会根据逻辑顺序一一介绍。step......
利用LangChain构建MySQL数据库问答代理
引言随着自然语言处理技术的飞速发展，尤其是大型语言模型（LLM）的应用日益广泛，人们对于如何更高效地与这些模型交互产生了浓厚的兴趣。LangChain是一个旨在简化与语言模型集成的开源框架，它使得开发者能够轻松地构建出强大的应用程序。本文将介绍如何使用LangChain结合MySQL数据......
Datawhale X 李宏毅苹果书 AI夏令营 Task3-机器学习实践方法论
在上一章介绍完机器学习模型后，我们接着讨论模型中可能存在的一些问题。首先我们需要明确一件事，就是Kaggle上的测试结果不好，可能有多个原因。第一，如果模型在运行训练模型时，所产生的损失就很大，那么有可能是模型偏差(modelbias)或优化(optimization)问题。第二，如果模型在运行训......
Datawhale X 李宏毅苹果书 AI夏令营-深度学习入门篇-Task3《深度学习详解》- 实践方法
核心学习目标：通过《深度学习详解》和李宏毅老师21年的机器学习课程视频，入门机器学习，并尝试学习深度学习，展开代码实践（选修）。该书保留了李宏毅老师公开课中大量生动有趣的例子，帮助读者从生活化的角度理解深度学习的概念、建模过程和核心算法细节，包括卷积神经网络、Transform......
使用docker部署tensorrtllm推理大模型baichuan2-7b
简介大模型的推理框架，我之前用过vllm和mindie。近期有项目要用tensorrtllm，这里将摸索的过程记录下，特别是遇到的问题。我的环境是Linux+rt3090准备docker环境本次使用docker镜像部署，需要从网上拉取：dockerpullnvcr.io/nvidia/tritonserver:24.08-trtllm-python-py3Th......
AI大模型系列之大模型原理科普（深度万字好文）
天地转，光阴迫。一万年太久，只争朝夕。数字时代，要顺势而为，让我们系统性掌握AI大模型家族的技术本领，成为行业翘楚！今天，我们突然发现，AI可以帮忙生成文字、图片、音频和视频等等内容了，而且让人难以分清背后的创作者到底是人类还是AI。这些AI生成的内容被叫做AIGC，它是AIgenerated......
数据库实验 SQL server sduwh caohai
问题一：根据E-R图写出关系模式，标注主键和外键学生关系模式：Student（StudentNum，StudentName，StudentSex,StudentAge,StudentPhone,StudentBrith，Speciality）其中主键为学号StudentNum，没有外键。课程关系模式：Course（Coursenum,CourseName,Credit,Classhour,ClassType）其中主键为......

第二天学习笔记：Datawhale X 李宏毅苹果书 AI夏令营

相关文章

赞助商

阅读排行