4.2 多层感知机的从零开始实现

时间：2023-06-29 12:11:31浏览次数：50

标签：hiddens num nn 4.2 torch 感知机从零开始 randn Parameter

本节实现一个单隐藏层的，具有256个隐藏单元的多层感知机，并且隐藏层使用ralu函数激活。注意，我们通常选择2的若干次幂作为层的隐藏单元数，因为内存在硬件中的分配和寻址方式，这么做往往可以在计算上更高效。

1. 参数初始化

我们用几个张量来表示我们的参数。注意，对于每一层我们都要记录一个权重矩阵和一个偏置向量。

num_inputs, num_outputs, num_hiddens = 784, 10, 256

#这个nn.Parameter就是声明变量是一个神经网络参数，不加也没关系
#torch.randn()创建均值为0，方差为1的标准正态分布张量，参数为张量的形状,这里是形状为(num_inputs,num_hiddens)(第一课pytorch数据处理有过)
#这里randn产生的随机数乘上0.01，如果外面不加一个nn.Parameter包起来的话会报错，说什么不能优化非叶子的tensor：can't optimize a non-leaf Tensor
W1 = nn.Parameter(torch.randn(
    num_inputs, num_hiddens, requires_grad=True) * 0.01)
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
W2 = nn.Parameter(torch.randn(
    num_hiddens, num_outputs, requires_grad=True) * 0.01)
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))

params = [W1, b1, W2, b2]

2. 定义激活函数relu

def relu(X):
    a = torch.zeros_like(X)
    return torch.max(X, a)

3. 定义模型

记得我们从数据集中拿到的X是1*28*28的，而我们目前不考虑其空间结构，要将其作为一个784的向量输入。

def net(X):
    X = X.reshape((-1, num_inputs))
    H = relu(X@W1 + b1)  # 这里“@”代表矩阵乘法
    return (H@W2 + b2)

4. 定义损失函数

由于之前已经实现过交叉熵损失了，我们这里直接使用torch.nn自带的交叉熵损失函数：

loss = nn.CrossEntropyLoss(reduction='none')

5. 训练

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)

标签：hiddens,num,nn,4.2,torch,感知机,从零开始,randn,Parameter
From： https://www.cnblogs.com/pkuqcy/p/17513887.html

【从零开始学微服务】06.微服务架构的建设思路
大家好，欢迎来到万猫学社，跟我一起学，你也能成为微服务专家。微服务看起来很美，但其实是需要一个技术体系或平台体系来支撑并且落地的。微服务架构建设分为两种思路：框架模式服务网格（ServiceMesh）模式接下来我们对上面的两个思路进行详细的介绍和对比。框架框架模式的典型代......
11. 配置ContextPath【从零开始学Spring Boot】
Springboot默认是/，这样直接通过http://ip:port/就可以访问到index页面，如果要修改为http://ip:port/path/访问的话，那么需要在Application.properties文件中加入server.context-path=/你的path,比如：spring-boot,那么访问地址就是http://ip:port/spring-boot路径。server.context-......
9. 使用JdbcTemplate【从零开始学Spring Boot】
整体步骤：(1) 在pom.xml加入jdbcTemplate的依赖；(2) 编写DemoDao类，声明为：@Repository，引入JdbcTemplate(3) 编写DemoService类，引入DemoDao进行使用(4) 编写Demo2Controller进行简单测试。具体操作流程如下：使用JdbcTemplate类需要加入（如果在JPA已经加入的话，这......
8. 使用JPA保存数据【从零开始学Spring Boot】
在看这一篇文档的话，需要先配置好JPA–Hibernate。总体步骤：(1) 创建实体类Demo,如果已经存在，可以忽略。(2) 创建jparepository类操作持久化。(3) 创建service类。(4) 创建restful请求类。(5) 测试代码如下：com.kfit.test.bean.Demo：package......
7. JPA - Hibernate【从零开始学Spring Boot】
在说具体如何在springboot使用Hibernate前，先抛装引玉些知识点？什么是JPA呢？JPA全称JavaPersistenceAPI.JPA通过JDK5.0注解或XML描述对象－关系表的映射关系，并将运行期的实体对象持久化到数据库中。http://baike.baidu.com/link?url=LdqIXvzTr0RDjY2yoRdpogDdzaZ_L-DrIOpLLzK1z38......
如何使用AI从零开始创业
从头开始创业是一项具有挑战性的工作，需要大量的努力和奉献。幸运的是，随着人工智能技术的出现，这个过程变得越来越容易。这听起来好得令人难以置信，但人工智能实际上已经跨越了现在可以完全从头开始做生意的地步，而且时间也少得可笑！在本文中，我们将介绍一些为此推荐的工具，以及如何使用......
【从零开始学微服务】03.软件架构的演化过程
大家好，欢迎来到万猫学社，跟我一起学，你也能成为微服务专家。目前大部分的企业系统和互联网应用都是采用Web的形式提供服务能力，根据系统的组织方式和部署结构，我们通常把软件架构的演化过程分为以下几个阶段：单体架构垂直架构SOA架构微服务架构单体架构单体架构，也被成为巨石......
[ARM 汇编]高级部分—性能优化与调试—3.4.2 ARM汇编程序调试技巧
在ARM汇编程序开发过程中，调试是一个关键环节。适当的调试技巧可以帮助我们更快地定位问题、解决问题，从而提高开发效率。本节将讲解一些ARM汇编程序的调试技巧，并通过实例进行讲解。使用GDB调试GDB（GNU调试器）是一个功能强大的调试工具，它支持ARM汇编程序的调试。以下是使用GDB进行......
[QML]从零开始QML开发（二）QML开发，浅谈控件、槽函数、锚等基本概念。QML和C++怎么交互？贯
[QML]从零开始QML开发（二）QML开发，浅谈控件、槽函数、锚等基本概念。QML和C++怎么交互？贯彻落实MVC原则先看代码：importQtQuick2.12importQtQuick.Window2.12importQtQuick.Controls2.5Window{visible:truewidth:320height:480title:qsTr("HelloW......
感知机（Perceptron）
受大脑启发的人工智能程序的一个早期例子是感知机（Perceptron），它由心理学家弗兰克·罗森布拉特于20世纪50年代末提出。感知机是一种基于神经网络的二分类模型，它可以用于对输入数据进行分类任务。感知机的结构简单，易于实现和训练，是神经网络的基础。大脑神经系统大脑神经系统无论从构造......