首页 > 其他分享 >简单的模型——线性回归

简单的模型——线性回归

时间:2024-11-04 10:46:38浏览次数:6  
标签:iris df 模型 DataFrame pd 线性 data 回归 columns

从机器学习的角度出发,所谓线性回归,指的是自变量(特征)加权求和汇总求得因变量(标签)的过程,比如,我们以前上学时,见到的函数y=w1x1+w2x2+b就是一个非常典型的线性回归模型,在进一步学习这个模型之前,我们需要讲解一些建模过程中应用到的概念。

# 导入相关包
import numpy as np
import pandas as pd
# 忽略这个库,后面会讲
from sklearn.datasets import fetch_california_housing, load_iris
iris_df = load_iris()
# iris_df.keys()
iris_df["data"].shape
(150, 4)
iris_df = load_iris()
pd.DataFrame(iris_df["data"],columns=iris_df['feature_names'])

在上述数据集中,每一行代表一朵花的记录结果,而其中每一列代表所有花的一项共同指标

以上的表格表示的数据集特征列,数据集除了特征列之外,还应用包含目标列数据,目标列数据描述了每一朵花的所属类别。

iris_df["target"].shape
pd.DataFrame(iris_df["target"],columns=['目标列'])

合并这些数据,组合成真正的数据集

data = pd.concat([pd.DataFrame(iris_df["data"],columns=iris_df['feature_names']),pd.DataFrame(iris_df["target"],columns=['labels'])],axis=1)
data

数据集中的前四列也被称为数据集的特征(features),而最后一列被称为数据集的标签(labels),我们在实际建模过程中,当需要利用模型进行预测时时,也是通过输入模型一些样本的特征(一些鸢尾花的四个特征取值),让模型进行每个样本的标签判别(判别每一朵花应该属于哪一类)

标签:iris,df,模型,DataFrame,pd,线性,data,回归,columns
From: https://blog.csdn.net/2201_75827149/article/details/143478535

相关文章

  • CMDB模型管理:构筑高效IT运维的坚实基础
    在CMDB中,模型是一个非常重要的概念,在前面的文章中我们提到了模型对于保障CMDB数据准确性的重要性。那么,要如何理解CMDB的模型呢?模型在CMDB中又是什么地位?能起到什么作用呢?一、模型概述在CMDB中,模型指的是对IT基础设施中各种配置项(ConfigurationItems,简称CI)的抽象表示,包括......
  • Python中的生产者-消费者模型:多进程与多线程的实践
    Python中的生产者-消费者模型:多进程与多线程的实践在现代编程中,生产者-消费者模型是一种常见的设计模式,用于处理任务队列和并发执行。Python提供了多种工具来实现这一模型,包括threading模块和multiprocessing模块。本文将通过一个实际的案例——从网页上批量下载图片——来......
  • Linux 五种IO模型
    IO模型概述IO模型的定义在Linux操作系统中,I/O模型是指用户空间应用程序与内核空间之间进行数据交换的方式1。这些模型通过系统调用(SystemCall)实现,为应用程序提供了访问内核功能的接口API1。主要目的是优化数据传输效率,提高系统的并发处理能力,从而改善整体性能。常见的I/......
  • 深入理解多重共线性:基本原理、影响、检验与修正策略
    在数据科学和机器学习领域,构建可靠且稳健的模型是进行准确预测和获得有价值见解的关键。然而当模型中的变量开始呈现出高度相关性时,就会出现一个常见但容易被忽视的问题——多重共线性。多重共线性是指两个或多个预测变量之间存在强相关性,导致模型难以区分它们对目标变量的贡......
  • R语言贝叶斯:INLA下的贝叶斯回归、生存分析、随机游走、广义可加模型、极端数据的贝叶
    原文链接:R语言贝叶斯:INLA下的贝叶斯回归、生存分析、随机游走、广义可加模型、极端数据的贝叶斯分析https://mp.weixin.qq.com/s?__biz=MzUzNTczMDMxMg==&mid=2247625527&idx=8&sn=ba4e50376befd94022519152609ee8d0&chksm=fa8daad0cdfa23c6106c5a9b304b09915c0223fbfb01b7c4f6......
  • 多特征变量序列预测(八)基于麻雀优化算法的CEEMDAN-SSA-BiLSTM预测模型
    往期精彩内容:时序预测:LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较全是干货|数据集、学习资料、建模资源分享!EMD变体分解效果最好算法——CEEMDAN(五)-CSDN博客拒绝信息泄露!VMD滚动分解+Informer-BiLSTM并行预测模型-CSDN博客风速预测(一)数据集介绍和预处理_风......
  • Python轴承故障诊断 (17)基于TCN-CNN并行的一维故障信号识别模型
    往期精彩内容:Python-凯斯西储大学(CWRU)轴承数据解读与分类处理Pytorch-LSTM轴承故障一维信号分类(一)-CSDN博客Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客Pytorch-Transformer轴承故障一维信号分类(三)-CSDN博客三十多个开源数据集|故障诊断再也不用担心数据集了!P......
  • Python轴承故障诊断 (16)高创新故障识别模型(二)
    往期精彩内容:Python-凯斯西储大学(CWRU)轴承数据解读与分类处理Pytorch-LSTM轴承故障一维信号分类(一)-CSDN博客Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客Pytorch-Transformer轴承故障一维信号分类(三)-CSDN博客三十多个开源数据集|故障诊断再也不用担心数据集了!P......
  • 【初阶数据与算法】线性表之顺序表的定义与实现
    文章目录一、线性表的概念二、顺序表1.概念与结构2.顺序表的分类静态顺序表动态顺序表三、顺序表的实现1.顺序表的结构2.顺序表的初始化和销毁初始化函数销毁函数3.顺序表的扩容4.顺序表的尾插和头插尾插函数头插函数5.顺序表的尾删和头删尾删函数头删函数6.顺序表......