002 线性回归的简洁实现

时间：2023-05-18 09:55:20浏览次数：35

标签：简洁 nn batch 002 参数线性 net data size

1. 创建数据集

数据集的手工创建和上一节一样，人为设置true_w,true_b,以及num_examples(样本的总数量)，调用synthetic_data()函数来创建。上一节中我们已经用#@save将这个函数保存在了d2l包中，这里我们直接调用就可以了：

2. 读取数据集

load_array()这个函数接受数据集的features,labels以及batch_size作为参数，返回一个数据加载器DataLoader，参数data_arrays就是features以及labels构成的元组(tuple)。我们用data_iter作为名字接住返回的这个DataLoader，并且由于load_array的定义包含了batch_size，所以data_iter能够按batch_size从数据集中加载数据。

data.TensorDataset(*data_arrays)用于对tensor进行打包，包装成dataset，dataset = data.TensorDataset(*data_arrays)也就生成了数据集。DataLoader()函数中，要以参数的形式指明要加载的数据集、batch_size，以及是否随机训练。这里我们使用iter构造Python迭代器，并使用next从迭代器中获取第一项。

3. 定义模型

我们可以使用pytorch中预定义好的层来定义模型：

nn是network的缩写； Sequential可以理解为一个list of layers，里面是按顺序的一个一个的层。Linear(2,1)接受了两个参数，2和1，第一个参数2表示输入神经元的个数，即输入的features的特征个数是2，第二个参数1表示输出的神经元的个数，即输出的labels有一个特征。 Sequential类将多个层串联在一起。当给定输入数据时，Sequential实例将数据传入到第一层，然后将第一层的输出作为第二层的输入，以此类推。

4. 模型参数初始化

深度学习框架通常有预定义的方法来初始化参数。

在这里，我们通过net[0]访问神经网络的第一层，分别通过net[0].weight以及net[0].bias访问这一层的权重和偏置，再通过.data访问这些数据，对它们进行初始化，注意，使用框架初始化参数，normal_和fill_后面有个下划线。

5. 定义损失函数

我们在线性模型中使用的是平均平方损失函数，它在nn中的定义是nn.MSELoss()：

默认情况下，它返回所有样本的损失的平均值。

6. 定义优化算法

优化器的定义要对torch.optim.SGD()传入两个参数：网络的参数net.parameters()以及学习率lr：

注意这个trainer是有网络的参数的信息的，所以在训练的时候，梯度清零可以直接用trainer.zero_grad()，更新参数可以直接用trainer.step()。

7. 训练

注意l = loss(net(X),y)，loss()函数是nn.MSELoss()，默认情况下它返回的是所有样本的损失的平均值，因此反向传播的时候是l.backward()，而不是l.sum().backward()。

本节完整代码：

import torch
import random
from d2l import torch as d2l
from torch.utils import data

true_w = torch.tensor([2,-3.4])
true_b = 4.2
features,labels = d2l.synthetic_data(true_w,true_b,1000)

def load_data(data_arrays,batch_size,is_train=True):
    dataset = data.TensorDataset(*data_arrays)
    return data.DataLoader(dataset,batch_size,is_train)

net = nn.Sequential(nn.Linear(2,1))
loss = nn.MSELoss()
trainer = torch.optim.SGD(net.parameters(),lr=0.03)
net[0].weight.data.normal_(0,0.01)
net[0].bias.data.fill_(0)

num_epochs = 3
batch_size = 10
data_iter = load_data((features,labels),batch_size)
for epoch in range(num_epochs):
    for X,y in data_iter:
        l = loss(net(X),y)
        trainer.zero_grad()
        l.backward()
        trainer.step()
    train_l = loss(net(features),labels)
    print(f'epoch {epoch+1}  loss {train_l:f}')

标签：简洁,nn,batch,002,参数,线性,net,data,size
From： https://www.cnblogs.com/pkuqcy/p/17408491.html

动手学深度学习(一) 线性回归
线性回归主要内容包括：线性回归的基本要素线性回归模型从零开始的实现线性回归模型使用pytorch的简洁实现线性回归的基本要素模型为了简单起见，这里我们假设价格只取决于房屋状况的两个因素，即面积（平方米）和房龄（年）。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与......
分解商业周期时间序列：线性滤波器、HP滤波器、Baxter滤波器、Beveridge Nelson分解等去
原文链接：http://tecdat.cn/?p=23000最近我们被客户要求撰写关于分解商业周期时间序列的研究报告，包括一些图形和统计输出。本文包含各种过滤器，可用于分解南非GDP的方法。我们做的第一件事是清除当前环境中的所有变量。这可以通过以下命令进行分解南非GDP数据本文包含各种过滤器......
001 线性回归的从零开始实现
1.生成数据集我们生成一个包含1000个样本的数据集，每个样本包含从标准正态分布中采样的2个特征。我们的合成数据集是一个矩阵函数synthetic_data()接收线性模型的w，b以及要生成的样本的数量为参数，创建样本的特征矩阵X以及标签向量y，分别返回： torch.normal(0,1,(nums_exa......
无人机VESC7500，低压伺服keil源码，可以无感，霍尔单馈，正余弦，ABZ等多种反馈信号，是用非线性
无人机VESC7500，低压伺服keil源码，可以无感，霍尔单馈，正余弦，ABZ等多种反馈信号，是用非线性磁链观测器，高频注入等多种算法于一身，上位机源码，原理图。没有PCB！最大电流300A，是学习不错的资料。ID:13295688026550883......
电机过调制算法模型从线性调制区到过调制区，算法已在量产车中验证过
电机过调制算法模型从线性调制区到过调制区，算法已在量产车中验证过电子文件产品ID:65490675862786288......
Pytorch实现线性回归模型
目录(1)构造一组输入数据X和其对应的标签y(2)构建模型(3)指定好参数和损失函数(4)训练模型(5)测试模型预测结果(6)模型的保存与读取(7)使用GPU进行训练初识pytorch,本文基于pytorch构建最基本的神经网络，实现线性回归模型。(1)构造一组输入数据X和其对应的标签yx_values=[i......
利用遗传算法GA优化SVM，做多输入单输出的拟合预测模型，可以出真实值和预测值的拟合对比
利用遗传算法GA优化SVM，做多输入单输出的拟合预测模型，可以出真实值和预测值的拟合对比图，也可以出线性回归拟合预测图，还有预测集的误差，同时可以打印多个评价指标，有利于用于数据分析。ID:8640676396815047......
蝴蝶优化算法(BOA)文章复现(Circle混沌初始化种群+非线性因子w、p、r+融合正余弦算法
蝴蝶优化算法(BOA)文章复现(Circle混沌初始化种群+非线性因子w、p、r+融合正余弦算法改进局部搜索策略+逐维t分布扰动策略)——MSBOA复现内容包括:文章改进BOA算法实现、23个基准测试函数、文中相关因子分析、文中混沌特性分析、与BOA对比等。代码基本上每一步都有注释，非......
缎蓝园丁鸟优化算法（SBO）文章复现（非均匀变异策略+非线性权重改进位置更新+互利因子改进
缎蓝园丁鸟优化算法（SBO）文章复现（非均匀变异策略+非线性权重改进位置更新+互利因子改进位置更新）——ISBO。复现内容包括:改进算法实现、23个基准测试函数、文中相关因子分析、文中相关图分析、与SBO对比等。代码基本上每一步都有注释，非常易懂，代码质量极高，便于新手学习和理解......
正余弦优化算法(SCA)文章复现(a参数非线性化+算法简化提高效率)——PSCA、ESCA、SA
正余弦优化算法(SCA)文章复现(a参数非线性化+算法简化提高效率)——PSCA、ESCA、SA复现内容包括:文章改进SCA算法实现、23个基准测试函数、文中相关因子分析、与SCA对比等。代码基本上每一步都有注释，非常易懂，代码质量极高，便于新手学习和理解。ID:8259670180699426......