首页 > 其他分享 >3.2 鱼与熊掌可以兼得的深度学习-2022

3.2 鱼与熊掌可以兼得的深度学习-2022

时间:2023-06-17 23:12:48浏览次数:33  
标签:Function 鱼与熊掌 Network Piecewise 可以 3.2 2022 所示 Linear

1. 问题回顾

  在上节的再谈宝可梦、数码宝贝分类问题上,我们提出了机器学习的分类原理.并提出了一个矛盾点:当可选参数过多,loss会变小,但理想和现实差距会很大;当可选参数比较少,loss会变大,但理想和现实差距会减小.现在我们需要一个Loss小,可选参数也少的模型.
image

2. Why we need Hidden Layer?

2.1 Piecewise Linear

  我们可以通过一个Hidden Layer就可以制造出所有可能的Function.如下图所示,现在我们要找一个Function,用Network去产生图中的线.我们将图中的线分成几等分,然后将端点连接起来得到Piecewise Linear.从图中我们可以发现如果绿色的线段足够多,就可以让绿色的线和黑色的线越来越接近.
image
  而绿色的线可以看作常数项加上一堆蓝色的Function.
image
  Piecewise Linear可以逼近任何\(function\),所以任何function可以由Neural Network表示.那么Neural Network怎么表示Piecewise Linear呢?我们可以使用Sigmoid Function近似地表示蓝色阶梯形的线(Hard Sigmoid).
image
  如下图所示,每一个neuron都可以制造出蓝色阶梯形的线,然后把它们加起来,再加上常数项,就可以产生Piecewise Linear.
image
  所以我们只要有足够多的neuron,我们就可以产生其它任何的Function.

2.2 Hard Sigmoid → ReLU

  Hard Sigmoid Function可以由两个ReLU Function所组成,ReLU Function如下图所示.
image
  如下图所示,假设Network里面的neuron都是ReLU.只要有足够多的ReLU,把它们组合起来,就可以变成Piecewise Linear,这个Piecewise Linear可以逼近任何的Function.
image
  那么我们会说只要有一个足够宽的 Hidden Layer就可以模拟任何function,那么为什么需要deep呢?

3. Deeper is Better?

  如下图所示,这里是对语音辨识性能的研究.我们可以发现Network越深,错误率越低.当我们把Network越叠越深时,H就会越来越大,理想的Loss会越来越低,就算有足够多的资料量,理想与现实也不会差太多.
image
  深度学习不仅需要大模型,也需要大量的训练资料.如果没有大量的训练资料,就会出现overfitting.

4. Fat + Short v.s. Thin + Tall

  如下图所示,我们可以让模型横向发展,也就是把模型变胖,这样也可以制造很大的模型.现在我们让Shallow Network和Deep Network有一样的参数,看谁的表现更好?
image
  如上图所示,当参数量相同时(同一行参数量近似),Deep Network比Shallow Network的表现更好,错误率更低.

5. Why we need deep?

  看了上面实验,我们可能会提出一个疑问,为什么将Network变高会比Network变胖更有效呢?
  当表示某一个Function时,使用Deep的架构更加有效率,因为Deep使用的参数比Shallow使用的参数少.
image

6. Analogy – Logic Circuits

  

标签:Function,鱼与熊掌,Network,Piecewise,可以,3.2,2022,所示,Linear
From: https://www.cnblogs.com/newblg/p/17488451.html

相关文章

  • [openeuler]Yocto & embedded 联合sig例会 (2022-12-15)
                     ......
  • Day03 3.2 HOOK
    Day033.2HOOK【一】hook框架fridaHook框架是一种技术,用于在运行时拦截和修改应用程序的行为。通过Hook,你可以劫持应用程序的方法调用、修改参数、篡改返回值等,以达到对应用程序的修改、增强或调试的目的常见的有:XposedFramework:Xposed是一个功能强大的开源H......
  • 搭建发卡平台需要什么配置的服务器?103.219.30.x
    能看到这篇文章的,多数都是想要搭建自己的发卡平台,搭建发卡平台需要有源码、备案域名和服务器,今天我就给你们分享一下搭建发卡平台用什么服务器配置比较好?发卡网对服务器的稳定性和安全性的要求相对一般,如果是按照云服务器的配置来选择,建议宜高不宜低,配置越高,稳定性和安全性就越好。......
  • 仿真软件Proteus下载-Proteus2022最新版下载 软件大全
    Proteuspro官方版是一款非常专业的现代eda工具软件,又简称为proteus8.11,同时也是Proteus系列的最新版本,是目前市场上深受广大用户喜爱的最好用、最优质的仿真单片机及外围器件的工具,为专业PCB设计解决方案,经济高效,提供完整的快速原型制作工具,可用于各个行业领域,基于形状的自动路由......
  • 服务器内存跑满是什么原因造成的 43.248.101.x
    相信大家在使用服务器的时候会有出现内存使用率比较高的情况,那接下来小编跟大家说下到底是哪些原因导致内存不足:一、应用程序池应用程序池有一个默认回收的时间,到了这个时间就会自动释放内存,这个时间一般是1740分钟,而这种程度的时间可能会导致应用程序池无法及时释放内存,从而出现内......
  • vue3:vue+nginx+php进行服务端部署的配置(nginx/1.18.0 / [email protected])
    一,开发环境中的配置:1,前端:vue的vue.config.jsconst{defineConfig}=require('@vue/cli-service')module.exports=defineConfig({transpileDependencies:true,publicPath:process.env.NODE_ENV==="production"?"./":"/&qu......
  • QGIS3.22.0+VS2019 window10编译
    首先感谢博客 济南友泉软件有限公司提供的顺序教程。博客地址:https://blog.csdn.net/qq_26221775/article/details/122792445这篇博客主要是表示编译时遇到的坑。1.一定使用vs2019进行编译。我刚开始想使用vs2017编译。因此遇到了两个坑。(1)vs2017编译qgis_cor......
  • Adobe InCopy CC2022【IC编写辅助软件】中文直装版安装教程
    ic2022是一款功能强大的辅助编写软件,其全名叫AdobeInCopy2022,也是一款由Adobe公司提供的软件,如ps、InDesign、pr等,这些都是一些企业经常使用的软件。而且该软件也是许多企业或个人用户喜爱的软件,软件的主要功能是帮助用户进行文案编辑和修改,是为作者、在编辑中,设计者们专门制作了......
  • Adobe Prelude CC2022【Pl视频编辑软件】中文直装版安装教程
    dobePrelude是一个很好的视频编辑软件。该软件结合了优异的性能、优美的改进用户界面和许多奇妙的创意功能,包括WarpStabilizer、动态时间轴切割、扩展多机编辑、调整图层等。该专业视频捕获程序允许转换任何文件格式和设置标记。该应用程序提供了对文件准备过程的有效管理,并立即......
  • Adobe Media Encoder CC2022【视频与音频编码工具】安装教程
    新款AdobeMediaencoder2022正式上线,又称Me2022,该软件不仅为用户提供了转换视频、音频格式等功能,使用户能够转换各种视频或音频格式,或为不同的应用程序开发和各种格式编码音视频文件。还提供了各种专业的硬件设备编码格式设置和设计预设设置,包括视频渲染、剪切、摄取、转码等。更......