首页 > 其他分享 >分类模型

分类模型

时间:2023-12-19 20:33:43浏览次数:29  
标签:训练组 变量 模型 分类 测试 logistic

分类模型

二分类模型

对于二分类模型,介绍逻辑回归(logistic regression)和Fisher线性判别分析两种分类算法;对
于多分类模型,将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤

水果分类例子

file


这个实际上就是一个二分类问题,通过属性推断类别。

逻辑回归logistic regression

file

注意:对于因变量为分类变量的情况,我们可以使用逻辑回归进行处理。把y看成事件发生的概率,y>=0.5表示发生;y<0.5表示不发生

线性概率模型(Linear Probability Model,简记LPM)

file

但是会出现问题。预测值可能会出现大于1以及小于0的情况,这种是不符合概率的异常。

两点分布(伯努利分布)

file

连接函数的取法

file

由于后者有解析表达式(而标准正态分布的cdf没有),所以计算logistic模型比probit模型更为方便

函数图像对比

file

怎么求解?

file

怎么用于分类?

file

将求出来的beta代入得到的结果大于0.5则预测的y = 1,否则 y =0

spss求解二分类

数据预处理:生成虚拟变量

file

file

file

这样就变成了数值变量了。

Spss求解逻辑回归

file

预测成功率

file

逻辑回归系数表

file

file


表格中新添的两列解读

file

逐步回归分析

file

假如自变量有分类变量怎么办?

file

两种方法
(1)先创建虚拟变量,然后删除任意一列以排除完全多重共线性的影响;
(2)直接点击分类,然后定义分类协变量,Spss会自动帮我们生成。

预测结果较差怎么办?

可在logistic回归模型中加入平方项、交互项等

file

加入平方项后结果

file

过拟合现象

file

不是说高次项越多越好的!

如何确定合适的模型

把数据分为训练组和测试组,用训练组的数据来估计出模型,再用测试组的数据来进行测试。(训练组和测试组的比例一般设置为80%和20%)
已知分类结果的水果ID为1‐38,前19个为苹果,后19个为橙子。
每类水果中随机抽出3个ID作为测试组,剩下的16个ID作为训练组。(比如:17‐19、36‐38这六个样本作为测试组)比较设置不同的自变量后的模型对于测试组的预测效果。

为了消除偶然性的影响,可以对上述步骤多重复几次,最终对每个模型求一个平均的准确率,这个步骤称为交叉验证

欢迎订阅
file

本文由博客一文多发平台 OpenWrite 发布!

标签:训练组,变量,模型,分类,测试,logistic
From: https://www.cnblogs.com/xiaocrblog/p/17914673.html

相关文章

  • R语言群组变量选择、组惩罚group lasso套索模型预测分析新生儿出生体重风险因素数据和
    原文链接:http://tecdat.cn/?p=25158原文出处:拓端数据部落公众号 本文拟合具有分组惩罚的线性回归、GLM和Cox回归模型的正则化路径。这包括组选择方法,如组lasso套索、组MCP和组SCAD,以及双级选择方法,如组指数lasso、组MCP。还提供了进行交叉验证以及拟合后可视化、总结和预测的实......
  • matlab使用长短期记忆(LSTM)神经网络对序列数据进行分类|附代码数据
    全文下载链接:http://tecdat.cn/?p=19751本示例说明如何使用长短期记忆(LSTM)网络对序列数据进行分类。最近我们被客户要求撰写关于LSTM的研究报告,包括一些图形和统计输出。要训练深度神经网络对序列数据进行分类,可以使用LSTM网络。LSTM网络使您可以将序列数据输入网络,并根据序列......
  • 阿里-可视化建模-评估模型
    登录PAI控制台,进入工作流页面。操作详情请参见step1:进入工作流页面。构建预测节点。在组件列表中分别搜索预测组件,找到后将其拖入画布,并将生成的节点作为拆分-1、逻辑回归二分类-1节点的下游节点,拼接为实验。单击画布中的预测-1节点,在右侧节点配置中,分别单击特征列字段、......
  • 阿里-可视化建模-模型部署及训练
    快速开始预置了多种预训练模型。您可以基于预训练模型快速上手并使用PAI的训练和部署功能。本文为您介绍如何在快速开始查找适合您业务需求的模型、部署和调试模型、微调训练模型。前提条件如果您需要对模型进行微调训练或增量训练,需要创建OSSBucket存储空间,具体操作请参见控......
  • C语言实现TCP CS模型代码,客户端服务器
    服务端将接受客户端发送的数据并将其转换成大写形式,然后再发送给客户端,客户端将发送一个字符串给服务器,并显示来自服务器的响应内容。服务器点击查看代码#include<stdio.h>#include<stdlib.h>#include<string.h>#include<sys/socket.h>#include<netinet/in.h>#......
  • 数据仓库之星型模型和雪花模型
    在了解星型模型和雪花模型之前,我们需要先了解一下事实表和维度表到底是什么?一、事实表与维度表事实表在数据仓库中,保存度量值的详细值或存储事实记录的表称为事实表。事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关......
  • 超越巨头:Zephyr-7B领跑7B级模型竞赛,开源且笔记本可运行
    引言在AI界的大语言模型(LLM)竞赛中,Zephyr-7B作为HuggingFaceH4团队的最新力作,展现了令人瞩目的技术突破。它不仅性能超越了700亿参数的LLaMA2模型,更引人注目的是,这一开源模型可在常规笔记本电脑上运行,极大地提高了AI技术的可达性。技术背景Zephyr-7B基于MistralAI的开源大模型Mis......
  • 大语言模型训练数据常见的4种处理方法
    本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》,作者:码上开花_Lancer。大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然,截止到2023年9月为止,还没有非常好的大模型的理论分析......
  • 手绘风格3D游戏场景模型纹理贴图
    在线工具推荐:3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.jsAI自动纹理开发包 - YOLO虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎当谈到游戏角色的3D模型风格时,有几种不同的风格:写实风格:这种风格追求高度真实......
  • 手绘风格人物3D模型纹理贴图
    在线工具推荐:3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.jsAI自动纹理开发包 - YOLO虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎当谈到游戏角色的3D模型风格时,有几种不同的风格:写实风格:这种风格追求高度真实......