首页 > 编程语言 >机器学习算法原理——逻辑斯谛回归

机器学习算法原理——逻辑斯谛回归

时间:2023-05-08 16:39:46浏览次数:44  
标签:似然 逻辑 函数 回归 算法 斯谛 模型


文章目录

  • 逻辑斯谛回归
  • 二项逻辑斯谛回归模型
  • 极大似然估计
  • 多项逻辑斯谛回归模型
  • 总结归纳

逻辑斯谛回归

写在前面:逻辑斯谛回归最初是数学家 Verhulst 用来研究人口增长是所发现的,是一个非常有趣的发现过程, b 站有更详细的背景及过程推导,在此不再赘述:https://www.bilibili.com/video/BV1No4y1o7ac/?p=59

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k9DMmgs6-1677676936475)(逻辑斯谛回归.assets/image-20230301153119470.png)]

逻辑斯谛分布的标准形式:
机器学习算法原理——逻辑斯谛回归_算法

机器学习算法原理——逻辑斯谛回归_概率密度函数_02

  • 分布函数是一条 机器学习算法原理——逻辑斯谛回归_算法_03 形曲线,该曲线也被称为 sigmoid 曲线,关于点 机器学习算法原理——逻辑斯谛回归_算法_04
  • 概率密度函数一条钟型曲线,中间高两端低,关于 机器学习算法原理——逻辑斯谛回归_上传_05

逻辑斯谛回归的一般形式:

机器学习算法原理——逻辑斯谛回归_算法_06 是连续随机变量, 机器学习算法原理——逻辑斯谛回归_算法_06 服从逻辑斯谛分布是指 机器学习算法原理——逻辑斯谛回归_算法_06 具有下列分布函数和概率密度:
机器学习算法原理——逻辑斯谛回归_概率密度函数_09

机器学习算法原理——逻辑斯谛回归_上传_10

式中, 机器学习算法原理——逻辑斯谛回归_算法_11 为位置参数, 机器学习算法原理——逻辑斯谛回归_算法_12

  • 分布函数是一条 机器学习算法原理——逻辑斯谛回归_算法_03 形曲线,该曲线也被称为 sigmoid 曲线,关于点 机器学习算法原理——逻辑斯谛回归_回归_14
  • 概率密度函数一条钟型曲线,中间高两端低,关于 机器学习算法原理——逻辑斯谛回归_算法_15 对称,在此处取得最大值 机器学习算法原理——逻辑斯谛回归_回归_16

二项逻辑斯谛回归模型

机器学习算法原理——逻辑斯谛回归_上传_17

机器学习算法原理——逻辑斯谛回归_算法_18

其中,机器学习算法原理——逻辑斯谛回归_概率密度函数_19 是输入,机器学习算法原理——逻辑斯谛回归_回归_20 是输出,机器学习算法原理——逻辑斯谛回归_算法_21机器学习算法原理——逻辑斯谛回归_机器学习_22 是参数,机器学习算法原理——逻辑斯谛回归_上传_23 称为权值向量,机器学习算法原理——逻辑斯谛回归_回归_24 称为偏置,机器学习算法原理——逻辑斯谛回归_上传_25机器学习算法原理——逻辑斯谛回归_概率密度函数_26机器学习算法原理——逻辑斯谛回归_概率密度函数_26

为了方便,将权重向量和输入向量加以扩充,仍记为 机器学习算法原理——逻辑斯谛回归_上传_23机器学习算法原理——逻辑斯谛回归_概率密度函数_26 ,则有:
机器学习算法原理——逻辑斯谛回归_概率密度函数_30
逻辑分布函数重写为:
机器学习算法原理——逻辑斯谛回归_回归_31

机器学习算法原理——逻辑斯谛回归_机器学习_32

极大似然估计

二项分布:
机器学习算法原理——逻辑斯谛回归_算法_33
对于 机器学习算法原理——逻辑斯谛回归_上传_34 ,有:
机器学习算法原理——逻辑斯谛回归_回归_35
其中:
机器学习算法原理——逻辑斯谛回归_机器学习_36
对于数据集 机器学习算法原理——逻辑斯谛回归_算法_37 出现的概率:
机器学习算法原理——逻辑斯谛回归_机器学习_38
该概率只与 机器学习算法原理——逻辑斯谛回归_上传_23 有关,即可得关于 机器学习算法原理——逻辑斯谛回归_上传_23 的似然函数:
机器学习算法原理——逻辑斯谛回归_机器学习_41
对数似然函数:
机器学习算法原理——逻辑斯谛回归_回归_42
代入(12)(13)式:
机器学习算法原理——逻辑斯谛回归_上传_43
这样,问题就变成了以对数似然函数为目标函数的最优化问题,可以应用极大似然估计法估计模型参数,从而得到逻辑斯谛回归模型。逻辑斯谛回归学习中通常采用的方法是梯度下降法拟牛顿法

多项逻辑斯谛回归模型

二项逻辑斯谛回归模型可将其推广到多项逻辑斯谛回归模型(multi-nominal logistic regression model),用于多类分类。假设离散型随机变量 机器学习算法原理——逻辑斯谛回归_机器学习_44 的取值集合是 机器学习算法原理——逻辑斯谛回归_上传_45 ,那么多项逻辑斯谛回归模型是:
机器学习算法原理——逻辑斯谛回归_算法_46
这里,机器学习算法原理——逻辑斯谛回归_概率密度函数_47机器学习算法原理——逻辑斯谛回归_上传_48

总结归纳

  • 逻辑斯谛回归归根结底是将分类问题用回归模型来解决。
  • 正态分布是在给定均值和方差的情况下具有最大熵的分布,这样的假设可以使得数据携带的信息量最大。通常在没有任何假设的情况下,连续型数据常被假设为正态分布,离散型数据常被假设为等概率分布。
  • 机器学习算法原理——逻辑斯谛回归_概率密度函数_49
  • 逻辑斯谛回归学习中通常采用的方法是梯度下降法拟牛顿法
  • 逻辑回归模型不局限于输入变量和输出变量之间是否存在线性关系,可以通过 sigmoid 函数代替非连续型函数,当 sigmoid 函数大于等于 0.5时即可判断类别。
  • 逻辑回归的输入变量可以是连续变量,也可以是离散变量
  • 参数估计:说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。
  • 极大似然估计:极大似然估计就是建立在参数估计的思想上,已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。
  • sigmoid 激活函数在深度学习中应用广泛,逻辑斯谛回归更是在分类问题中被大量使用。


标签:似然,逻辑,函数,回归,算法,斯谛,模型
From: https://blog.51cto.com/u_15251606/6254901

相关文章

  • 电动汽车用内置式永磁同步电机基于查询表 的矢量控制算法, 自动生成?
    电动汽车用内置式永磁同步电机基于查询表的矢量控制算法,自动生成满足MTPA(最大转矩电流比/MTPV(最大转矩电压比)的dq轴电流参考值查询表。程序使用m脚本文件编写,将生成的查询表以C语言二维数组的形式输入到txt文本文件中,可直接复制到应用程序中,避免工程师对数据进行二次提......
  • 采用simulink仿真嵌入C语言实现了逆变器的搭建,整个仿真没有一个模块,所有算法均用C语言
    采用simulink仿真嵌入C语言实现了逆变器的搭建,整个仿真没有一个模块,所有算法均用C语言实现,并对C语言代码给出了详尽的注释。逆变器输出的电压THD仅有0.4%。可以根据这个例子写自己的算法,并把在simulink中写的代码直接移植到DSP或者别的控制器中的中断中,不需要做任何修改。ID:55200......
  • 在服务器中提交lammps计算时,用多少个核计算,才会使得自己和别人的运算会更快?是不是提交
    (摘自以下内容)下边我们做几组测试,并对比计算速度:(采用同一个模型,所含原子数:19144(算挺得多了))4个核——未超负荷运行100%情况下——1天能跑0.488ns=488ps26个核——超负荷10个核运行——1天能跑0.023ns=23ps56个核——超负荷40个核运行——1天能跑0.018ns=18ps126个核—......
  • jmeter逻辑控制器使用
    一、jemeter控制器的种类1.简单控制器(SimpleController)作用:分组,用来组合取样器和其他逻辑控制器 2.循环控制器(LoopController)作用:控制该控制器下请求的循环次数例如下图中线程数为2,循环控制器次数为3,执行后HomePage执行了2次,NewsPage执行了6次(线程2*循环3次)如果勾选了f......
  • 学习笔记 - 基础算法
    基础算法三分模板题P3382【模板】三分法doublelmid,rmid;doubleconsteps=1e-6;while(r-l>eps){lmid=(l*2+r)/3;rmid=(r*2+l)/3;if(F(lmid)>F(rmid))r=rmid;elsel=lmid;}cout<<l<<'\n';......
  • MySQL中的Join 的算法(NLJ、BNL、BKA)
    本文已收录至Github,推荐阅读......
  • Day 29 29.2 MD5摘要算法
    哈希算法--MD5摘要算法【一】Hash算法哈希算法也称摘要算法、散列算法哈希函数的输入为一段可变长度x,输出一固定长度串,该串被称为x的哈希值。Hash函数满足以下几个基本需求:(1)输入值x为任意长度(2)输出值长度固定(3)单向函数,算法不可逆(4)唯一性,很难找到两个不同的输入......
  • 四种语言刷算法之环形链表 II
    力扣142. 环形链表II1、C/***Definitionforsingly-linkedlist.*structListNode{*intval;*structListNode*next;*};*/structListNode*detectCycle(structListNode*head){if(head==NULL||head->next==NULL)returnNULL;stru......
  • 十四、JVM-垃圾相关算法(基础篇)
    一、标记阶段:引用计数算法1、对象存活判断在堆里存放着几乎所有的Java对象实例,在GC执行垃圾回收之前,首先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记为己经死亡的对象,GC才会在执行垃圾回收时,释放掉其所占用的内存空间,因此这个过程我们可以称为垃圾标记阶......
  • 区域生长算法与图像分割
    1.区域生长区域生长是一种串行区域分割的图像分割方法。区域生长是指从某个像素出发,按照一定的准则,逐步加入符合相似性判据的邻近像素,当满足生长停止条件,区域生长终止。其中相似性判据可以是像素灰度值、颜色、纹理特征等图像信息。(另一种区域生长是先将图像分割成很多的一......