001 线性回归的从零开始实现

时间：2023-05-16 22:11:24浏览次数：44

标签：nums batch len 维度 001 从零开始 examples 线性 size

1. 生成数据集

我们生成一个包含1000个样本的数据集，每个样本包含从标准正态分布中采样的2个特征。我们的合成数据集是一个矩阵

函数synthetic_data()接收线性模型的w，b以及要生成的样本的数量为参数，创建样本的特征矩阵X以及标签向量y，分别返回：

torch.normal(0,1,(nums_examples,len(w)))生成均值为0，方差为1，形状为(nums_examples,len(w))的随机正太分布数据，作为样本的特征矩阵。注意这特征值和标签值都是随机生成的，这是没有任何现实意义的数据集，仅作为熟悉线性回归流程的工具。

注意：如果返回y的时候直接返回y，而不是返回y.reshape(-1,1)，会出现这样的问题：X的维度是(nums_examples,len(w)),w的维度是(len(w))，matmul(X,w)下来维度是(nums_examples)，而不是(nums_examples,1)。而我们想要的维度是(nums_examples,1)。注意，矩阵向量积虽然mv(X,w)和matmul(X,w)结果是一样的，它们在处理的过程中会将w的维度变成(len(w),1)，与X进行计算，但算完了保存结果时，结果的维度是(nums_examples)的。

2. 读取数据集

我们定义一个函数data_iter(batch_size,features,labels)，传入整个数据集的features，labels，以及我们每次要读取的batch_size的大小，使用yield让这个函数循环地返回每个batch_size的features以及labels：

首先，我们使用num_examples = len(features)获取整个数据集的样本的个数，然后，创建随机访问的索引indices，函数random.shuffle(indices)用于将列表indices中的数据随机打乱。yield关键词用于返回features[batch_indices]和labels[batch_indices]的值，并与下面的for循环联动，将这些值循环地传入X，y中。

3. 初始化模型参数

注意到模型的参数为w和b。我们将w初始化为均值为0，方差为0.01的正态分布，将b初始化为0：

4. 定义模型

模型的定义是，给定我们输入特征X，以及参数w，b，用来输出样本标注y的函数：

注意，上面的Xw是一个向量，而b是一个标量（Xw和b都是张量），计算Xw+b时，会采用广播机制，Xw的每一个值都会加上b。

5. 定义损失函数

损失函数的定义是，传入真实值y和估计值y_hat，返回在定义的损失函数下的损失的过程。

这里面我们把y给reshape成了y_hat的形状，是为了保证万无一失。（在本例中不reshape也能正常运行）

6. 定义优化算法

优化算法是传入模型的全部参数、学习率以及 batch_size，各个参数根据自己的梯度优化自己的过程：

这里要加with torch.no_grad():，表示下面的过程不需要计算梯度，不加就会报错，暂时搞不清楚什么原因；

注意参数更新完之后，一定要把它们的梯度清零，以便下一个batch_size的训练。

7. 训练

我们首先定义学习率、batch_size、num_epochs，即要训练多少个epoch。

这里面[w,b]是一个list，它的两个元素都是torch.tensor类型的，w是一个有两个元素的tensor，b是一个标量tensor。

对于{float(train_l.mean()):f}，用float是将它从tansor强制转换成float型，冒号f，即":f"的意思是要将这个float型变量用六位小数输出。

可以看到，我们每次取出来一个batch_size，都是可以对全局所有的参数进行更新的。

标签：nums,batch,len,维度,001,从零开始,examples,线性,size
From： https://www.cnblogs.com/pkuqcy/p/17402847.html

无人机VESC7500，低压伺服keil源码，可以无感，霍尔单馈，正余弦，ABZ等多种反馈信号，是用非线性
无人机VESC7500，低压伺服keil源码，可以无感，霍尔单馈，正余弦，ABZ等多种反馈信号，是用非线性磁链观测器，高频注入等多种算法于一身，上位机源码，原理图。没有PCB！最大电流300A，是学习不错的资料。ID:13295688026550883......
电机过调制算法模型从线性调制区到过调制区，算法已在量产车中验证过
电机过调制算法模型从线性调制区到过调制区，算法已在量产车中验证过电子文件产品ID:65490675862786288......
Pytorch实现线性回归模型
目录(1)构造一组输入数据X和其对应的标签y(2)构建模型(3)指定好参数和损失函数(4)训练模型(5)测试模型预测结果(6)模型的保存与读取(7)使用GPU进行训练初识pytorch,本文基于pytorch构建最基本的神经网络，实现线性回归模型。(1)构造一组输入数据X和其对应的标签yx_values=[i......
Makefile基础教程：从零开始学习
在软件开发过程中，Makefile是一个非常重要的工具，它可以帮助我们自动构建程序，管理程序依赖关系，提高开发效率。本篇博客将从基础开始，介绍Makefile的相关知识，帮助大家快速掌握Makefile的使用方法Makefile是什么Makefile是一个非常强大的构建程序工具，主要用于管理程序的依赖关系和构......
GYM100198G - PL/Cool
比较毒瘤的一道模拟。首先，我们考虑如何处理define，我们发现，其中不会出现环，并且所有冲突的定义以第一个为准，那么就想到并查集，将\(x\)的父亲定成\(y\)。只不过我们平时的并查集是无向的，这里是有向的，也就是谁是根是重要的。我们先给所有的定义和被定义的变量映射到一个值，然后用......
利用遗传算法GA优化SVM，做多输入单输出的拟合预测模型，可以出真实值和预测值的拟合对比
利用遗传算法GA优化SVM，做多输入单输出的拟合预测模型，可以出真实值和预测值的拟合对比图，也可以出线性回归拟合预测图，还有预测集的误差，同时可以打印多个评价指标，有利于用于数据分析。ID:8640676396815047......
使用MASA Stack+.Net 从零开始搭建IoT平台第四章 4.1处理设备上行数据-获取并通知业
目录前言分析方案共享订阅带群组的共享订阅均衡分发策略数据格式实施流程编写代码验证效果总结前言物联网平台首先需要可以获取并处理设备上报的MQTT中的数据，我们称这部分为上行数据。本章将分为三小节。1、通过MQTT获取设备上报数据并通知业务系统2、业务系统存储和处理上......
从零开始搞基建（5）——代码质量
一、AppWorksAppWorks是一款基于VSCode插件的前端研发工具集。1）AppWorksDoctor我试用了其中的代码质量检测插件，这款插件会依赖package.json文件。所以当前项目的根目录中需要包含此文件，否则无法运行命令。在Mac环境中，Ctrl+Shift+P快捷键后弹......
NI LabVIEW OPC Server OPC通讯IO服务器，通讯西门子S720030040012001500SMART通讯三菱F
NILabVIEWOPCServerOPC通讯IO服务器，通讯西门子S720030040012001500SMART通讯三菱FXPLCQPLC台达PLC欧姆龙PLC等全系列PLCDSCModleNIDSCOPC工具包ID:3460671157181864......
蝴蝶优化算法(BOA)文章复现(Circle混沌初始化种群+非线性因子w、p、r+融合正余弦算法
蝴蝶优化算法(BOA)文章复现(Circle混沌初始化种群+非线性因子w、p、r+融合正余弦算法改进局部搜索策略+逐维t分布扰动策略)——MSBOA复现内容包括:文章改进BOA算法实现、23个基准测试函数、文中相关因子分析、文中混沌特性分析、与BOA对比等。代码基本上每一步都有注释，非......