首页 > 编程语言 >机器学习_线性回归_岭回归算法预测波士顿房价代码实现(机器学习全流程)(附带数据集housingData下载链接, 长期有效)

机器学习_线性回归_岭回归算法预测波士顿房价代码实现(机器学习全流程)(附带数据集housingData下载链接, 长期有效)

时间:2024-10-14 13:50:41浏览次数:3  
标签:机器 boston 回归 housingData test train print import data


# 1.导入外部数据集HousingData
import pandas as pd
boston_data=pd.read_csv(r"C:\Users\鹰\Desktop\ML_Set\HousingData.csv")

# 数据基本描述
print(boston_data.head())
print(boston_data.describe())
print(boston_data.shape)

# 2.数据基本处理-缺失值处理,特征值和目标值确定, 数据集分割
# 缺失值处理-删除存在缺失值的数据行
print("缺失值:")
print(boston_data.isna().sum())
# if (~boston_data).any():
#     print("删除...")
#     boston_data= boston_data.dropna()
#     print(boston_data.isna().sum())
print("删除...")
boston_data= boston_data.dropna()
print(boston_data.isna().sum())
# 确定特征值和目标值, iloc[]取值
x_all=boston_data.iloc[:,:-1]
y_all=boston_data.iloc[:,-1]
# 数据集分割
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x_all,y_all,test_size=0.2)

# 3.特征工程-特征预处理-标准化
# 特征预处理:统一单位, 进行标准化处理
from sklearn.preprocessing import StandardScaler
sacler=StandardScaler()
sacler.fit_transform(x_train)
sacler.fit_transform(x_test)
# 特征转换和特征降维暂时不需要

# 4.模型训练-选择调用模型--1.Ridge回归, 2.RidgeCV交叉验证岭回归
from sklearn.linear_model import Ridge, RidgeCV
# estimator=Ridge(alpha=1)
estimator=RidgeCV(alphas=(0.001, 0.01, 0.1, 1, 10, 100, 1000))
estimator.fit(x_train, y_train)

# 5.模型评估
# 预测值, 利用测试集的特征值进行训练
y_predict=estimator.predict(x_test)
print(f"predict_values(预测值) are \n {y_predict}")
# 准确率, 通过测试集的特征值和目标值进行训练
score=estimator.score(x_train,y_train)
print(f"accuracy(准确率) is {score}")
# 线性回归评价指标-MSE
from sklearn.metrics import mean_squared_error
mse=mean_squared_error(y_test, y_predict)
print(f"MSE(均方误差) is {mse}")




 

需要下载数据集的兄弟们, 看这里

链接:https://pan.baidu.com/s/1uQiYeN5QYwIBAWj9LG1EgQ 
提取码:oem8

作者的废话

作为辛辛苦苦下载不到数据集的小白, 我太理解这种感受了, 只有有机会, 我就会共享下载链接,

咱们可以花钱, 但不能花这种冤枉钱呀, 

其实, 生活中, 很多答案, 只要多留心一点, 都是可以找到的, 

简言之, 只要思想不滑坡, 方法总比困难多, 这碗鸡汤, 我干了, 你随意

借用一句话, think big,  strat small

 

标签:机器,boston,回归,housingData,test,train,print,import,data
From: https://blog.csdn.net/JR521314/article/details/142916415

相关文章

  • 机器学习——自动化机器学习(AutoML)
    机器学习——自动化机器学习(AutoML)自动化机器学习(AutoML)——2024年的新趋势什么是AutoML?1.0AutoML的关键组成部分AutoML的优势1.0AutoML实例:使用Auto-sklearn进行回归分析AutoML的应用领域2024年值得关注的AutoML工具持续发展的趋势自动化机器学习(AutoML)——让机器学......
  • Pytho逻辑回归算法:面向对象的实现与案例详解
    这里写目录标题Python逻辑回归算法:面向对象的实现与案例详解引言一、逻辑回归算法简介1.1损失函数1.2梯度下降二、面向对象的逻辑回归实现2.1类的设计2.2Python代码实现2.3代码详解三、逻辑回归案例分析3.1案例一:简单二分类问题问题描述数据代码实现输出结果3问......
  • 第十期机器学习基础 01深度学习基础
    一:机器学习和深度学习对比(一)传统机器学习什么是传统机器学习?传统机器学习是指一系列能够从数据中学习规律,并根据这些规律进行预测和决策的算法。它通常包括以下几种类型的算法:线性回归和逻辑回归:用于解决回归和分类问题----可以认为:逻辑回归是在线性回归基础上加上sigmod方法......
  • 第十期机器学习基础 03GPT的发展
    一:GPT-1---预测未来在自然语言中,大量的未标记文本语料库非常丰富,但是有标签的数据训练的效果比较好,如果想要在没有标签的数据集上训练出好的模型比较难。因此作者提出了一个想法,在无标签的数据上训练一个预训练模型,然后在这些有标签的子任务上训练一个微调模型。(当时之前是CV领......
  • 第十期机器学习基础 02注意力机制和Transformer/Bert
    一:注意力机制(一)前提背景1.人类的选择性视觉注意力视觉注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过快速扫描全局图像,获得需要重点关注的目标区域,也就是一般所说的注意力焦点,而后对这一区域投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无......
  • 【触想智能】工控一体机在智能机器人领域应用的优势与市场展望
    随着科技的不断发展,智能机器人在工业领域扮演着越来越重要的角色。而工控一体机作为智能机器人的核心部件之一,具有许多独特的优势,为智能机器人的广泛应用提供了强大的支持。下面触想智能小编,将和大家一起探讨工控一体机在智能机器人领域的应用优势,并对其市场进行展望。......
  • Python 中快速上手机器学习的基础算法
    机器学习作为一种让计算机从数据中自动学习的技术,在近年来得到了迅猛发展。本文将介绍几种基础的机器学习算法,并通过Python代码示例展示它们的应用。1.什么是机器学习机器学习是一种让计算机学会从数据中自动“学习”并做出预测或决策的技术。不需要显式地编程告诉计算机......
  • 从零开始学机器学习——了解分类算法
    分类算法首先给大家介绍一个很好用的学习地址:https://cloudstudio.net/columns分类算法是监督学习的一种重要方法,它与回归算法在许多方面有相似之处。监督学习的核心目标是利用已有的数据集进行预测,无论是数值型数据还是类别型数据。具体而言,分类算法主要用于将输入数据归类为不......
  • 吴恩达机器学习笔记(2-1到2-7)
    吴恩达机器学习笔记(2-1到2-7)https://www.bilibili.com/video/BV164411b7dx?p=5https://www.bilibili.com/video/BV164411b7dx?p=6https://www.bilibili.com/video/BV164411b7dx?p=7https://www.bilibili.com/video/BV164411b7dx?p=8https://www.bilibili.com/video/BV164411b......
  • 【2024年诺贝尔物理学奖颁发给了机器学习与神经网络领域的研究者,其影响力标志的未来是
    (目录)欢迎关注微信公众号:数据科学与艺术*近日,2024年诺贝尔物理学奖颁发给了机器学习与神经网络领域的研究者,这是历史上首次出现这样的情况。这项奖项原本只授予对自然现象和物质的物理学研究作出重大贡献的科学家,如今却将全球范围内对机器学习和神经网络的研究和开发作为了一种......