首页 > 其他分享 >【2022.11.02】机器学习名词记录

【2022.11.02】机器学习名词记录

时间:2022-11-02 11:23:21浏览次数:94  
标签:02 未知数 函数 sigmoid 名词 可以 相加 折线图 2022.11

学习来源均来自:https://www.bilibili.com/video/BV1Wv411h7kN

image-20221101094633217

当我们设定函数的时候,不一定是线性的情况下,可以将一个曲线图拆分成多个函数相加

image-20221101143518565

正如下图中的红色图,是由四条曲线相加得到

image-20221101143453377

如果要将折线图模拟成曲线图的话,一般使用sigmoid来逼近原来的折线图

image-20221101143427021

改变不同的参数获得的不同结果

image-20221101144015706

上面的红色折线图就可以由四个sigmoid函数组成

image-20221101144408416

然后将我们想要的内容整理一下,就可以将上图灰框内的数字整合成下面图中的样子

image-20221101145512848

image-20221101145327017

最后整理一下就可以得到结果

image-20221101145714277

将所有的未知数放到一列

image-20221101150055174

当参数很少的时候,可以使用暴力的方法,试出所有的未知数

sigmoid的函数越多的时候可以越逼近原来的函数图像

当尝试了几次后,得到一个预估的y,其差值可以得到一个LOSS函数

image-20221101150641877

未知数拉长作为一个未知量的时候,成为一个向量,可以找出θ的start

然后要对每一个位置的参数进行求微分,集合起来就是一个向量

这里的g是梯度gradient

image-20221101164241467

将θ0的向量减去学习率×微分值,得到新的θ1

而在实际的机器学习中,并不会拿一个大L来计算梯度,而是将其拆分成多个Batch,分多次计算损失

每次更新一次参数叫做update,对每个batch变化也称为update

把所有的batch都看过一遍,叫做一个Epoch,可以有多次update,取决于batchSize有多大

image-20221101164539909

sigmoid比较难以计算,所以一个sigmoid可以看成是relu相加,第二个拐点后相加后位直线

relu是0与另一条直线的取大值得到的结果

image-20221102091415750

我们之前是只用了一层sigmoid来模拟原来的数据,我们可以将第一层的结果,放入下一个层数得到新的数据

其中的权重W‘和偏置b'是全新的未知数

image-20221102092003552

布置多层后,可以降低损失函数的数值

image-20221102105343994

我们一般将这些sigmoid和relu称之为神经元,很多的neuron就是神经网络

image-20221102105614766

其中每一层neuron被称之为layer,多层的layer被称为深度学习

image-20221102105752159

过拟合overfitting指的是在增加层数的基础上,在已知的数据上获得更好的数据,而在未知的数据上得到更差的结果

image-20221102110042413

标签:02,未知数,函数,sigmoid,名词,可以,相加,折线图,2022.11
From: https://www.cnblogs.com/mokou/p/16850404.html

相关文章

  • 电气赋能 绿色低碳-安科瑞参加 2022中国苏州智能建筑电气论坛
    2022年9月16日,安科瑞参加由江苏省土木建筑学会建筑电气专业委员会、苏州市土木建筑学会建筑电气与智能建筑专业委员会主办的2022中国苏州智能建筑电气论坛。    围绕......
  • 中勘协高校分会2022年建筑电气与智能化论坛
        2022年9月23日,安科瑞来到历史名城山西太原,参加在太原举办的中勘协高校分会2022年建筑电气与智能化论坛。安科瑞希望通过本次学术交流会,可以有效的提升企业品牌知......
  • 上海市电气工程设计研究会2022电气行业新技术、新发展交流展示会
    9月27日,上海市电气工程设计研究会2022电气行业新技术、新发展交流展示会在上海王宝和大酒店七楼会议室隆重召开。会议由上海市电气工程设计研究会主办,为电气行业新技术的发......
  • U-Net在2022年相关研究的论文推荐
    UNet可以算是FCN的一种变体,是最常用、最简单的一种分割模型,简单、高效、易懂、容易构建,且可以从小数据集中训练。2015年,UNet在论文U-Net:ConvolutionalNetworksfo......
  • 阅文-2023-秋招笔试
    编程题1-奇偶链表对于一个链表,按照先访问偶数下标的节点再访问奇数下标的节点重新排列思路是:奇偶两个指针交替移动并改变指针指向,最后将偶指针的下一个指向保存的第一......
  • 20221102模拟赛题解
    A-Holy思路由于要让最小值最大,不难想到二分答案。二分后将原矩阵中大于等于\(mid\)的值设为\(1\),小于的设为\(0\),然后将每一行压成二进制,存在两行满足要求当且仅当两......
  • VS2022 整个解决方案 快速查找失效--解决办法
    最近在使用Vs2022的过程中,发现了使用"快速查找(Ctrl+F)"整个解决方案时,内容搜索不出来的问题   但是不选择整个解决方案,选中本文档就可以查找到目标了。换成vs20......
  • 情绪日志-2022-11
    1101咨询话题专注于情绪的对话交流,让我社交的压力小很多不太将自己的注意力放在别人的身上,不再过多的关注别人的得失,没有较重的比较心理独处的能力有所提升,安静看书学......
  • 1602:烽火传递
    序列A,选择一些a[i],任意一个长度为m的区间内至少有一个所选的问sum{a[i]}的最小值 #include<iostream>#include<cstring>usingnamespacestd;constint......
  • CSP-S 2022 题解
    「CSP-S2022」假期计划\(1\toa\tob\toc\tod\to1\)中\(a,b,c,d\)是\(4\)个不同的景点是突破点,数据范围允许枚举其中的两个。便很自然想到枚举中间的\(b,c\),并......