1. 问题回顾

在上节的再谈宝可梦、数码宝贝分类问题上,我们提出了机器学习的分类原理.并提出了一个矛盾点:当可选参数过多,loss会变小,但理想和现实差距会很大;当可选参数比较少,loss会变大,但理想和现实差距会减小.现在我们需要一个Loss小,可选参数也少的模型.

2. Why we need Hidden Layer?

2.1 Piecewise Linear

我们可以通过一个Hidden Layer就可以制造出所有可能的Function.如下图所示，现在我们要找一个Function,用Network去产生图中的线.我们将图中的线分成几等分,然后将端点连接起来得到Piecewise Linear.从图中我们可以发现如果绿色的线段足够多,就可以让绿色的线和黑色的线越来越接近.

而绿色的线可以看作常数项加上一堆蓝色的Function.

Piecewise Linear可以逼近任何\(function\),所以任何function可以由Neural Network表示.那么Neural Network怎么表示Piecewise Linear呢?我们可以使用Sigmoid Function近似地表示蓝色阶梯形的线(Hard Sigmoid).

如下图所示，每一个neuron都可以制造出蓝色阶梯形的线，然后把它们加起来，再加上常数项，就可以产生Piecewise Linear.

所以我们只要有足够多的neuron,我们就可以产生其它任何的Function.

2.2 Hard Sigmoid → ReLU

Hard Sigmoid Function可以由两个ReLU Function所组成,ReLU Function如下图所示.

如下图所示,假设Network里面的neuron都是ReLU.只要有足够多的ReLU,把它们组合起来,就可以变成Piecewise Linear,这个Piecewise Linear可以逼近任何的Function.

那么我们会说只要有一个足够宽的 Hidden Layer就可以模拟任何function,那么为什么需要deep呢?

3. Deeper is Better?

如下图所示,这里是对语音辨识性能的研究.我们可以发现Network越深,错误率越低.当我们把Network越叠越深时,H就会越来越大,理想的Loss会越来越低,就算有足够多的资料量,理想与现实也不会差太多.

深度学习不仅需要大模型,也需要大量的训练资料.如果没有大量的训练资料,就会出现overfitting.

4. Fat + Short v.s. Thin + Tall

如下图所示,我们可以让模型横向发展,也就是把模型变胖,这样也可以制造很大的模型.现在我们让Shallow Network和Deep Network有一样的参数,看谁的表现更好?

如上图所示,当参数量相同时(同一行参数量近似),Deep Network比Shallow Network的表现更好,错误率更低.

5. Why we need deep?

看了上面实验,我们可能会提出一个疑问,为什么将Network变高会比Network变胖更有效呢?
当表示某一个Function时,使用Deep的架构更加有效率,因为Deep使用的参数比Shallow使用的参数少.

6. Analogy – Logic Circuits

标签：Function,鱼与熊掌,Network,Piecewise,可以,3.2,2022,所示,Linear
From： https://www.cnblogs.com/newblg/p/17488451.html

[openeuler]Yocto & embedded 联合sig例会 (2022-12-15)
......
Day03 3.2 HOOK
Day033.2HOOK【一】hook框架fridaHook框架是一种技术，用于在运行时拦截和修改应用程序的行为。通过Hook，你可以劫持应用程序的方法调用、修改参数、篡改返回值等，以达到对应用程序的修改、增强或调试的目的常见的有：XposedFramework：Xposed是一个功能强大的开源H......
搭建发卡平台需要什么配置的服务器？103.219.30.x
能看到这篇文章的，多数都是想要搭建自己的发卡平台，搭建发卡平台需要有源码、备案域名和服务器，今天我就给你们分享一下搭建发卡平台用什么服务器配置比较好？发卡网对服务器的稳定性和安全性的要求相对一般，如果是按照云服务器的配置来选择，建议宜高不宜低，配置越高，稳定性和安全性就越好。......
仿真软件Proteus下载-Proteus2022最新版下载软件大全
Proteuspro官方版是一款非常专业的现代eda工具软件，又简称为proteus8.11，同时也是Proteus系列的最新版本，是目前市场上深受广大用户喜爱的最好用、最优质的仿真单片机及外围器件的工具，为专业PCB设计解决方案，经济高效，提供完整的快速原型制作工具，可用于各个行业领域，基于形状的自动路由......
服务器内存跑满是什么原因造成的 43.248.101.x
相信大家在使用服务器的时候会有出现内存使用率比较高的情况，那接下来小编跟大家说下到底是哪些原因导致内存不足：一、应用程序池应用程序池有一个默认回收的时间，到了这个时间就会自动释放内存，这个时间一般是1740分钟，而这种程度的时间可能会导致应用程序池无法及时释放内存，从而出现内......
vue3:vue+nginx+php进行服务端部署的配置(nginx/1.18.0 / vue@3.2.37)
一，开发环境中的配置:1,前端:vue的vue.config.jsconst{defineConfig}=require('@vue/cli-service')module.exports=defineConfig({transpileDependencies:true,publicPath:process.env.NODE_ENV==="production"?"./":"/&qu......
QGIS3.22.0+VS2019 window10编译
首先感谢博客济南友泉软件有限公司提供的顺序教程。博客地址：https://blog.csdn.net/qq_26221775/article/details/122792445这篇博客主要是表示编译时遇到的坑。1.一定使用vs2019进行编译。我刚开始想使用vs2017编译。因此遇到了两个坑。（1）vs2017编译qgis_cor......
Adobe InCopy CC2022【IC编写辅助软件】中文直装版安装教程
ic2022是一款功能强大的辅助编写软件，其全名叫AdobeInCopy2022，也是一款由Adobe公司提供的软件，如ps、InDesign、pr等，这些都是一些企业经常使用的软件。而且该软件也是许多企业或个人用户喜爱的软件，软件的主要功能是帮助用户进行文案编辑和修改，是为作者、在编辑中，设计者们专门制作了......
Adobe Prelude CC2022【Pl视频编辑软件】中文直装版安装教程
dobePrelude是一个很好的视频编辑软件。该软件结合了优异的性能、优美的改进用户界面和许多奇妙的创意功能，包括WarpStabilizer、动态时间轴切割、扩展多机编辑、调整图层等。该专业视频捕获程序允许转换任何文件格式和设置标记。该应用程序提供了对文件准备过程的有效管理，并立即......
Adobe Media Encoder CC2022【视频与音频编码工具】安装教程
新款AdobeMediaencoder2022正式上线，又称Me2022，该软件不仅为用户提供了转换视频、音频格式等功能，使用户能够转换各种视频或音频格式，或为不同的应用程序开发和各种格式编码音视频文件。还提供了各种专业的硬件设备编码格式设置和设计预设设置，包括视频渲染、剪切、摄取、转码等。更......

3.2 鱼与熊掌可以兼得的深度学习-2022