简单的模型——线性回归

时间：2024-11-04 10:46:38浏览次数：6

标签：iris df 模型 DataFrame pd 线性 data 回归 columns

从机器学习的角度出发，所谓线性回归，指的是自变量（特征）加权求和汇总求得因变量（标签）的过程，比如，我们以前上学时，见到的函数y=w1x1+w2x2+b就是一个非常典型的线性回归模型，在进一步学习这个模型之前，我们需要讲解一些建模过程中应用到的概念。

# 导入相关包
import numpy as np
import pandas as pd
# 忽略这个库，后面会讲
from sklearn.datasets import fetch_california_housing, load_iris

iris_df = load_iris()
# iris_df.keys()
iris_df["data"].shape

(150, 4)

iris_df = load_iris()
pd.DataFrame(iris_df["data"],columns=iris_df['feature_names'])

在上述数据集中，每一行代表一朵花的记录结果，而其中每一列代表所有花的一项共同指标

以上的表格表示的数据集特征列，数据集除了特征列之外，还应用包含目标列数据,目标列数据描述了每一朵花的所属类别。

iris_df["target"].shape

pd.DataFrame(iris_df["target"],columns=['目标列'])

合并这些数据，组合成真正的数据集

data = pd.concat([pd.DataFrame(iris_df["data"],columns=iris_df['feature_names']),pd.DataFrame(iris_df["target"],columns=['labels'])],axis=1)
data

数据集中的前四列也被称为数据集的特征（features），而最后一列被称为数据集的标签（labels），我们在实际建模过程中，当需要利用模型进行预测时时，也是通过输入模型一些样本的特征（一些鸢尾花的四个特征取值），让模型进行每个样本的标签判别（判别每一朵花应该属于哪一类）

标签：iris,df,模型,DataFrame,pd,线性,data,回归,columns
From： https://blog.csdn.net/2201_75827149/article/details/143478535

CMDB模型管理：构筑高效IT运维的坚实基础
在CMDB中，模型是一个非常重要的概念，在前面的文章中我们提到了模型对于保障CMDB数据准确性的重要性。那么，要如何理解CMDB的模型呢？模型在CMDB中又是什么地位？能起到什么作用呢？一、模型概述在CMDB中，模型指的是对IT基础设施中各种配置项（ConfigurationItems，简称CI）的抽象表示，包括......
Python中的生产者-消费者模型：多进程与多线程的实践
Python中的生产者-消费者模型：多进程与多线程的实践在现代编程中，生产者-消费者模型是一种常见的设计模式，用于处理任务队列和并发执行。Python提供了多种工具来实现这一模型，包括threading模块和multiprocessing模块。本文将通过一个实际的案例——从网页上批量下载图片——来......
Linux 五种IO模型
IO模型概述IO模型的定义在Linux操作系统中，I/O模型是指用户空间应用程序与内核空间之间进行数据交换的方式1。这些模型通过系统调用(SystemCall)实现，为应用程序提供了访问内核功能的接口API1。主要目的是优化数据传输效率，提高系统的并发处理能力，从而改善整体性能。常见的I/......
深入理解多重共线性:基本原理、影响、检验与修正策略
在数据科学和机器学习领域,构建可靠且稳健的模型是进行准确预测和获得有价值见解的关键。然而当模型中的变量开始呈现出高度相关性时,就会出现一个常见但容易被忽视的问题——多重共线性。多重共线性是指两个或多个预测变量之间存在强相关性,导致模型难以区分它们对目标变量的贡......
R语言贝叶斯：INLA下的贝叶斯回归、生存分析、随机游走、广义可加模型、极端数据的贝叶
原文链接：R语言贝叶斯：INLA下的贝叶斯回归、生存分析、随机游走、广义可加模型、极端数据的贝叶斯分析https://mp.weixin.qq.com/s?__biz=MzUzNTczMDMxMg==&mid=2247625527&idx=8&sn=ba4e50376befd94022519152609ee8d0&chksm=fa8daad0cdfa23c6106c5a9b304b09915c0223fbfb01b7c4f6......
多特征变量序列预测(八)基于麻雀优化算法的CEEMDAN-SSA-BiLSTM预测模型
往期精彩内容：时序预测：LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较全是干货|数据集、学习资料、建模资源分享！EMD变体分解效果最好算法——CEEMDAN（五）-CSDN博客拒绝信息泄露！VMD滚动分解+Informer-BiLSTM并行预测模型-CSDN博客风速预测（一）数据集介绍和预处理_风......
Python轴承故障诊断 (17)基于TCN-CNN并行的一维故障信号识别模型
往期精彩内容：Python-凯斯西储大学（CWRU）轴承数据解读与分类处理Pytorch-LSTM轴承故障一维信号分类(一)-CSDN博客Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客Pytorch-Transformer轴承故障一维信号分类(三)-CSDN博客三十多个开源数据集|故障诊断再也不用担心数据集了！P......
Python轴承故障诊断 (16)高创新故障识别模型（二）
往期精彩内容：Python-凯斯西储大学（CWRU）轴承数据解读与分类处理Pytorch-LSTM轴承故障一维信号分类(一)-CSDN博客Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客Pytorch-Transformer轴承故障一维信号分类(三)-CSDN博客三十多个开源数据集|故障诊断再也不用担心数据集了！P......
【初阶数据与算法】线性表之顺序表的定义与实现
文章目录一、线性表的概念二、顺序表1.概念与结构2.顺序表的分类静态顺序表动态顺序表三、顺序表的实现1.顺序表的结构2.顺序表的初始化和销毁初始化函数销毁函数3.顺序表的扩容4.顺序表的尾插和头插尾插函数头插函数5.顺序表的尾删和头删尾删函数头删函数6.顺序表......

简单的模型——线性回归

相关文章

赞助商

阅读排行