首页 > 其他分享 >机器学习-线性回归-softmax回归 做多分类-10

机器学习-线性回归-softmax回归 做多分类-10

时间:2023-12-16 12:22:24浏览次数:29  
标签:10 概率 回归 分类 Xi softmax theta

1. softmax回归

伯努利分布(0-1分布 二分类),我们采用Logistic回归(用sigmoid函数映射到 0-1之间 输出预测概率)建模。
那么我们应该如何处理多分类问题?(比如要进行邮件分类;预测病情属于哪一类等等)。对于这种多项式分布我们使用softmax回归建模。

什么是多项分布?

多项式分布的目标值yε{1,2,3,...,k};(其中k是类别种数)其概率分布为:
并且:

联合分布的概率函数为:于是,多项分布转变为指数分布族的推导如下:

注意:
代表属于某一类发生的次数

代表某一类发生的概率

公式继续推导:

其中:

我们的目标是要计算出


至此,我们就得到了softmax回归的公式:

任意一条样本xi都能计算出 对应 k个分类的 概率
注意:这里的theta(也就是待求解的模型参数)是一个k行n列的矩阵。 k行是因为有k个分类, n列是应为x有n个维度

softmax多分类的原理:

交叉上损失函数:

m条样本 落在 1-k 类 类别里面
落入1类里面的次数 对应的概率φ1
落入2类里面的次数 对应的概率φ2
...
落入k类里面的次数 对应的概率φk
全部相乘

取对数:

总结:
多分类 使用 one-vs-rest 将多分类拆解成多个二分类 分别输出属于某一类的概率
例如:x有4个维度 4类 拆开成 6个二分类 输出 p1 p2 p3 p4作出预测
求解参数个数 4 * 6 = 24

使用softmax 多项式回归
exp(theta_1 * Xi ) exp(theta_2 * Xi ) exp(theta_3 * Xi ) exp(theta_4 * Xi ) / 总和 输出概率做预测
theta_1 theta_2 ... theta_4
4*4 = 16个参数需要计算

标签:10,概率,回归,分类,Xi,softmax,theta
From: https://www.cnblogs.com/cavalier-chen/p/17904699.html

相关文章

  • P2516 [HAOI2010] 最长公共子序列
    求方案数,直接从\(f[i-1][j]\)和\(f[i][j-1]\)转移过来,如果\(s1[i]==s2[j]\)就加上\(f[i-1][j-1]\),如果\(s1[i]!=s2[j]\)且\(f[i][j]==f[i-1][j-1]\)说明两边转移到了\(f[i-1][j-1]\),减去重复部分\(f[i-1][j-1]\)就行了。比较好的理解方式是画个网格图,如果\(s1[......
  • 蔡锦濠10天让你从菜鸡升大师Ⅱ
    C++提供了以下两种类型的字符串表示形式:    C风格字符串    C++引入的string类类型C 风格的字符串起源于C 语言,并在C++中继续得到支持。字符串实际上是使用 null 字符 \0 终止的一维字符数组。因此,一个以null结尾的字符串,包含了组成字符串的字......
  • 初中英语优秀范文100篇-028How to Be a Good Internet User-如何成为一名合格的网民
    PDF格式公众号回复关键字:SHCZFW028记忆树1Withthedevelopmentofthetechnology,mostofusareabletousetheInternet.翻译随着科技的发展,我们大多数人都能够使用互联网。简化记忆互联网句子结构这句话的结构是:时间状语从句(Withthedevelopmentofthet......
  • 100%硬核解决前端复杂动画的秘密武器!
    哈喽!大家好!我是程序视点的小二哥。前端开发中,总会遇到这样一个困境:动画还原。对于前端开发工程师,有的是这样做的。照着设计动画模仿,猜测动画时长,手创建贝塞尔曲线……调整细节耗时耗力,效果还差强人意...好不容易实现了,还原度却达不到要求在被UI设计折磨一顿后,小二哥找到了......
  • 解决方案 | pywintypes.com_error: (-2147221005, '无效的类字符串', None, None) --P
     1背景importpythoncomimportwin32com.clientimportmathwincad=win32com.client.Dispatch("AutoCAD.Application")#强制打开cad,该句发生报错信息doc=wincad.ActiveDocumentdoc.Utility.Prompt("Hello!Autocadfrompywin32com.\n")msp=doc.Mode......
  • 未来应用从何而来:认知力延伸、边界突破、回归云与产业
    文|智能相对论作者|沈浪或许,谁也没想到未来应用来的如此之快,现如今传统应用从开发到体验,已经进入了一个前所未有的颠覆性改革阶段。不久前,美国人工智能公司OpenAI举办开发者大会。在现场,公司创始人SamAltma花了短短3分钟的时间就完成了一个名为「创业导师GPT」应用的构建。这......
  • 2023.12.10-2023.12.23北京游记+总结
    Day6今天打了一场模拟赛T1:推出性质:每一个色块之间间隔大于\(k\),每一个色块中必然存在一个等于\(k\)的色段然后,不会用,想到计数问题一般直接推出式子或者\(dp\),看到这里的\(n\le10^{18}\),果断选择放弃\(dp\),推半天组合数ing最后打一个\(n^2\)的吧,......
  • 猫眼电影TOP100
    一、猫眼电影排行TOP100抓取(小案例)​ 声明:个人源码仅供自己学习记录,他人使用学习中切勿用于非法用途,请自觉遵守国家法律。造成的损失一概与本人无关。​ 本文记录了自己学习途中的代码,主要通过正则提取解析网页内容然后存储到本地。猫眼电影拥有反爬机制,使用爬虫加上延时一样会......
  • Win11无法启动SqlServer服务问题,SqlServer服务启动1067错误
    因为SQLServer当前支持512字节和4KB的扇区存储大小。所以需要将SqlServer安装到支持4KB的磁盘。以管理员权限运行PowerShell,执行fsutilfsinfosectorinfoC:命令查看各磁盘是否支持4kb存储查找以下字段值(单位为字节)PhysicalBytesPerSectorForAtomicityPhysicalBytesPe......
  • owasp-top10 2023 详解
    经典的TOP10漏洞 A1注入漏洞在2013、2017的版本中都是第一名,可见此漏洞的引入是多么的容易,同时也证明此漏洞的危害有多么严重。攻击方式利用应用程序弱点,通过恶意字符将恶意代码写入数据库,获取敏感数据或进一步在服务器执行命令。漏洞原因未审计的数据输入框使用网址直接传......