首页 > 其他分享 >06.深度学习--分类模型

06.深度学习--分类模型

时间:2023-03-16 19:24:03浏览次数:52  
标签:06 函数 -- 模型 分类 生成器 深度 类别 回归

分类模型

输入对象x,输出是这个对象属于哪一个类class,这样的应用同样有很多,比如:在金融上可以通过分类模型来决定是否贷款给某人;图像识别方面;人脸辨识方面,等等。

这里依然使用宝可梦的例子来进行说明, 我们可以通过宝可梦的几个属性来具体判断宝可梦是属于什么属性

如果按照一贯的三步走的方法,首先确定function,发现可以在f里面内置一个函数g将input放入后如果g>0则输出1,小于零则为1,适应于二分类问题,loss函数也是如果预测分类和真是类别不同则记一个数,否则不计数。

 

使用朴素贝叶斯公式可以计算出,这个神奇宝贝是来自于哪个类别的概率

 

 

逻辑回归

第一步:找到function set

根据上面的计算,我们可以得出初步的function,通过推导得出的结果就是一个sigmoid function,其输出的结果就是属于某一个类别的概率是多少

 

第二步:判断函数的好坏

加入我们有一个训练集有N个数据,这些数据都被标记好是属于第一类还是第二类,于是我们的L函数就是属于第一类的概率最大化即可,属于第一类的样本点直接用f(x)表示,是与第二类的在L函数里面用1-f(x)表示于是只要找到一组w和b让整个函数最大化即可

 

如果想要让计算变得更容易,那就通过一个数学变化取对数并且加上负号,只需要找到最小值即可,并且把y做一个符号上的转换,将第一类表示为1,将第二类表示是为0,于是可以用统一的格式将L函数写出来

 

写成一般式之后可以发现,一般式是两个伯努利分布的交叉熵

 

之后再用梯度下降的办法算出来

 

 

 

判别器和生成器

判别器:逻辑回归的方法,称为discriminative,判别式模型是直接建模,并根据某一数据直接预测

生成器:用Gaussian来描述后验概率这件事,称为generative,生成模型是模型先对联合概率分布P(X,Y)建模,能够学习出联合概率分布,然后由贝叶斯公式得出条件分布P(y|x),进而进行判断。

判别器和生成器所得参数值是不同的,因为生成器会有很多假设,比如使用的是高斯分布还是其他的概率模型等等。所以他们的回归结果是不同的。所以准确率会有所不同。

 

很多文献会说判别器的准确率会高于生成器。原因的话,看下面的例子,这个例子是用生成器来判断检验数据是哪一类别。所得概率居然小于0.5,而实际上人眼判断肯定是class1.为什么会出现这一情况呢?是因为生成器假设这些data来自于一个概率模型,它假设了全1的情况会出现在class2——脑补。而且这个概率也受到data数量的影响。

 

但其实有时候判别器也不总是高于生成器的:

  • 训练数据比较少的时候

  • 标签本来就有问题的时候,脑补会避免很多问题

  • 先验概率(priors)和类别相关概率(class-dependent probabilities)可以用不同的数据来源预估

多分类模型

用三种类别的分类进行举例

 

逻辑回归的局限性

在某些情况下,普通的逻辑回归并不能做到分类要求,所以需要有所改变。举个例子:正常来讲,我们更加希望如果是class1的话我们希望预测出来的y要大于0.5,如果是class2的话我们预测出来的y要小于0.5

 

无论如何设置分割线,都无法将两个类别清晰的分割在直线的两边

 

有两个办法:

  • Feature Transformation 特征转换

    但是特征的转换还是人工进行转换,依然具有一定的局限性

     

  • Cascading logistic regression models 级联逻辑回归模型

    可以理解为神经网络的另一种表示,将多个逻辑回归进行级联,前面的逻辑回归用来特征转换,后面的用来进行分类

     

     

     

     

 

标签:06,函数,--,模型,分类,生成器,深度,类别,回归
From: https://www.cnblogs.com/bolunwei/p/17223855.html

相关文章

  • 带你全方面了解字节 A/B 实验的文化与工具
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 A/B测试是在相同的环境下,通过随机的抽样把对照组和控制组进行区分,并分别实行新......
  • 【洛谷】P4139 上帝与集合的正确用法(扩展欧拉定理)
    原题链接题意求:\[2^{2^{2^{\ldots}}}\modp\]可以证明这个式子一定为一个常数。\(1\leqp\leq10^7\)思路根据扩展欧拉定理,可以得到:\[2^{2^{2^{\ldots}}}\equi......
  • 第13章 群
    对于不含幺元的有限循环半群\(<S,*>\):设\(|S|=n\),则该半群只有唯一的生成元\(a\),且\(S=\{a^1,a^2,...,a^n\}\)(即\(a^1,a^2,...,a^n\)互不相同)证明:对于生成元\(a\),\(a^1......
  • 494.Target Sum
    Youaregivenalistofnon-negativeintegers,a1,a2,...,an,andatarget,S.Nowyouhave2symbols + and -.Foreachinteger,youshouldchooseonefro......
  • 实验2
    task.1源码//task1.c#include<stdio.h>#include<stdlib.h>#include<time.h>#defineN5#defineR1586#defineR2701intmain(){intnumber;i......
  • centos7 安装 postgresql-9.2
    1.添加yum配置yuminstall-yhttp://download.postgresql.org/pub/repos/yum/9.2/redhat/rhel-7-x86_64/pgdg-centos92-9.2-3.noarch.rpm2.安装服务yumins......
  • 代码随想录(4)-字符串
    344.反转字符串题目:编写一个函数,其作用是将输入的字符串反转过来。输入字符串以字符数组s的形式给出。不要给另外的数组分配额外的空间,你必须原地修改输入数组、使用......
  • 线材测量有感
    做了内部线,上次线材的改进版,由于添加了wirecomb。但是这个wirecomb设计的上短下宽,导致背光抓取的边缘长度和实际在二次元下量取的长度有十几条的偏差。在将卡尺方向翻转......
  • UsageStatsService详解
     1.概述UsageStatsService它是收集、聚合和保存应用程序使用数据的服务,这些数据可以被AppOps授权的应用查询。源码路径framework/base/services/usage/java/com/an......
  • vb rest 接口 demo
    下面是帮一位使用vb.net的朋友做的一个最简单rest接口示例,详细源码见文章底部最终效果如下:默认查询返回jsonhttp://localhost:54370/Home/Index  默认创建......