首页 > 其他分享 >第三章线性模型

第三章线性模型

时间:2024-07-15 22:54:22浏览次数:17  
标签:正类 第三章 结果 模型 分类 学习 类别 线性

3.1 线性回归

线性模型的目的是通过学习得到一个属性线性组合的预测函数,基本形式为:f(x) = w1x1 + w2x2 + ... + wnxn + b
机器学习中一般用向量形式表示,即:f(x) = wTx + b,通过学习得到w和b,模型即得以确定。

那么什么样的w和b是我们想要的呢?也就是我们想通过学习得到怎样的w和b呢?
假设yi是第i个样本的真实结果,f(xi) = wxi + b是计算得到的预测结果,显然,使得f(xi)最接近yi的w和b就是我们想要的,对于总体样本来说,使得n个样本的总体预测结果最接近总体真实结果的w和b,自然就是我们想要学习得到的最终结果。

3.2 线性几率回归

对于二分类任务来说,我们一般使用sigmoid函数,也即对数几率函数(也就是神经网络中经常使用的逻辑回归):

                                ​​​​​​​        ​​​​​​​        ​​​​​​​        ​​​​​​​        

它的图形为:

在神经网络中,经常用到sigmoid函数作为激活函数或解决二分类问题,对于多分类,则较多使用softmax函数。

3.3 线性判别分析


线性判别分析LDA的原理是将样例肉应到一条直线上,使同类样例的投影点尽可能接近,而异类样例的投影点则尽可能远,对于新样例来说,将它投影到直线上,根据投影点的位置远近即可完成样例分类,下面是示意图:

3.4 多分类学习

现实中我们经常遇到不只两个类别的分类问题,即多分类问题,在这种情形下,我们常常运用“拆分”的策略,通过多个二分类学习器来解决多分类问题,即将多分类问题拆解为多个二分类问题,训练出多个二分类学习器,最后将多个分类结果进行集成得出结论。最为经典的拆分策略有三种:“一对一”(OvO)、“一对其余”(OvR)和“多对多”(MvM),核心思想与示意图如下所示。


OvO:给定数据集D,假定其中有N个真实类别,将这N个类别进行两两配对(一个正类/一个反类),从而产生N(N-1)/2个二分类学习器,在测试阶段,将新样本放入所有的二分类学习器中测试,得出N(N-1)个结果,最终通过投票产生最终的分类结果。
OvM:给定数据集D,假定其中有N个真实类别,每次取出一个类作为正类,剩余的所有类别作为一个新的反类,从而产生N个二分类学习器,在测试阶段,得出N个结果,若仅有一个学习器预测为正类,则对应的类标作为最终分类结果。
MvM:给定数据集D,假定其中有N个真实类别,每次取若干个类作为正类,若干个类作为反类(通过ECOC码给出,编码),若进行了M次划分,则生成了M个二分类学习器,在测试阶段(解码),得出M个结果组成一个新的码,最终通过计算海明/欧式距离选择距离最小的类别作为最终分类结果。
 

标签:正类,第三章,结果,模型,分类,学习,类别,线性
From: https://blog.csdn.net/qq_45632142/article/details/140451224

相关文章

  • AI预测福彩3D采取888=3策略+和值012路或胆码测试7月15日新模型预测第33弹
        周末去外地出差,断更了两天,今天开始恢复每日一发~        今天咱们继续验证新模型的8码定位=3,重点是预测8码定位=3+和值012+胆码。有些朋友看到我最近几篇文章没有给大家提供缩水后的预测详情,在这里解释下:其实我每篇文章中既有8码定位,也有和值012路,也有胆码......
  • 数据结构:线性表的链式表示
    继上文《数据结构:线性表的顺序表示》,我们知道线性表的主要操作如下:InitList(&L):初始化表length(L):求表长LocateElem(L,e):按值查找操作GetElem(L,i):按位查找操作ListInsert(&L,i,e):插入操作ListDelete(&L,i,&e):删除操作PrintList(L):输出操作Empty(L):判空操......
  • casbin的详细理解过程(附图片理解)(rbac模型)
    摘自:https://blog.csdn.net/weixin_51991615/article/details/123696937一、casbin模型casbin模型又叫PERM模型:subject(sub访问实体),object(obj访问的资源)和action(act访问方法)eft(策略结果,一般为空默认指定allow)还可以定义为deny1)Policy策略———p={sub,obj,act,eft}1......
  • OpenAI 曝新项目「草莓」,提升 AI 推理能力;智谱 AI 开源视频理解模型丨 RTE 开发者日报
      开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢......
  • 数据结构学习笔记——线性表
    链表1.单链表链表的插入:    (1)需要知道插入位置的前驱结点(从表头顺序遍历)    (2)先修改要插入的结点(新结点)的指针    (3)再修改前驱结点的指针链表的删除:    (1)要知道删除结点的前驱结点(从表头顺序遍历)    (2)只需要修改前驱结点的指......
  • 模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 - 性能优化
                                                   ......
  • Django 模型字段类型和字段参数总结
    models.AutoField作用说明:默认生成列名为id的列,并设置为主键数据类型:int(11)必备参数:primary_key=True作为主键存在主键django会默认自带ColName=models.AutoField(primary_key=True)2.models.CharField作用说明:字符串字段,长度小于255数据类型:varchar(50)必......
  • MoneyPrinterPlus全面支持本地Ollama大模型
    MoneyPrinterPlus现在支持批量混剪,一键AI生成视频,一键批量发布短视频这些功能了。之前支持的大模型是常用的云厂商,比如OpenAI,Azure,Kimi,Qianfan,Baichuan,TongyiQwen,DeepSeek这些。支持云厂商的原因是现在大模型使用基本都很便宜,并且大厂的稳定性,性能都比本地搭建要好很多......
  • 探索 GraphRAG:图结构与生成式模型的融合
    在当今数据驱动的时代,处理和理解复杂的图结构数据成为了一项重要的任务。GraphRAG(GraphRetrieval-AugmentedGeneration)作为一种新兴的技术,为解决图相关的问题提供了创新的思路和方法。一、GraphRAG简介GraphRAG是一种结合了图结构数据和生成式模型的技术框架。它旨在......
  • 深度解读昇腾CANN模型下沉技术,提升模型调度性能
    本文分享自华为云社区《深度解读昇腾CANN模型下沉技术,提升模型调度性能》,作者:昇腾CANN。AI模型的运行通常情况下需要CPU和NPU(昇腾AI处理器)等AI专用处理器协同工作,CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(Device)。对于采用Host调度的AI模型来说,Host下发Task的时序和Devi......