首页 > 其他分享 >深度学习这些“坑”你们有没有踩过(入门误区)

深度学习这些“坑”你们有没有踩过(入门误区)

时间:2023-02-24 15:33:26浏览次数:32  
标签:因素 入门 学习 神经网络 误区 拆分 深度 变体 共享

深度学习这些“坑”你们有没有踩过(入门误区)_神经网络

首先和大家说一声对不起,昨天由于平台安全问题,账号被黑入,发送了与本平台主旨背道而驰的内容,发现问题我们立马删除了,在此向大家说一声抱歉。

我们“计算机视觉战队”微信公众号,之后还会用心做我们该做的,希望没有给同学们带来困惑,也感谢大家长久以来的支持


最近很多新入门的同学加入我们的大家庭,陆续加入到我们的学习群。如果你是入门及想提升自己的同学,我希望你可以考虑加入我们知识星球,我们定时会有详细的相关领域知识分解,并给出相应的动手实践,手把手带大家熟悉每个分支的具体实施过程,也给大家带来更多的动力及兴趣。



今天我们给大家带来一些基础性的理解,有兴趣的同学可以细读,慢慢体会其中的一些知识,希望给大家来来一些帮助。谢谢~


定位深层学习在哪?

深层学习需要什么?

数学

线性代数:是有关任意维度空间下事物状态和状态变化的规则。

深度学习这些“坑”你们有没有踩过(入门误区)_权重_02

(推荐可以阅读这本书)

概       率:是用来衡量我们对事物在跨时间后不同状态的确信度。

深度学习这些“坑”你们有没有踩过(入门误区)_计算机视觉_03

(推荐可以阅读这本书)

编程


操作矩阵

实现数学想法

Python



学习的难点

其实就是学习寻找关联函数f的过程。

难点需要在未见过的任务上表现良好




有一种极端情况:

记忆:记住所有的训练样本和对应标签。

深度学习这些“坑”你们有没有踩过(入门误区)_权重_04


深度学习这些“坑”你们有没有踩过(入门误区)_权重_05

实际:无法被穷尽,各式各样的变体。

深度学习这些“坑”你们有没有踩过(入门误区)_计算机视觉_06

  

深度学习这些“坑”你们有没有踩过(入门误区)_权重_07

关于函数f的寻找

深度学习这些“坑”你们有没有踩过(入门误区)_神经网络_08

维度的问题

深度学习这些“坑”你们有没有踩过(入门误区)_计算机视觉_09


维度越大,我们越无法获得所有的情况。

深度学习这些“坑”你们有没有踩过(入门误区)_神经网络_10

面临没见过的情况,一般是将左右的情况平均一下。但是这种方法在高维数据下并不适用。

分布式表达

深度学习这些“坑”你们有没有踩过(入门误区)_权重_11

原本需要8个不同情况,现在只需要6个。因为8个变体是有3种因素组合而成的。

数字表示法:解决变化的因素。

椭圆这个factor实际上也是有变体的,可以以相同的思路继续拆分,继续降低训练所需数据量。


No Free Lunch Theorem


深度学习这些“坑”你们有没有踩过(入门误区)_权重_12

任何两个优化算法是等价的,当它们的性能是在所有可能的问题的平均值。



深度 VS 浅层

分布式表达是将变体拆分成因素。但是如果用无限节点的浅层网络,所拆分的变体并不会在不同样本之间形成共享。

而深层神经网络,由于拆分的变体可以在不同样本间共享,在浅层网络中只负责学习自己的关联,而在深层网络中,那些共用相同因素的样本也会被间接的训练到。换句话说,深层的优势在于节省了训练所需的数据量。

深度学习这些“坑”你们有没有踩过(入门误区)_计算机视觉_13

关键:因素的共享


深层神经网络

学习的过程是因素间的关系的拆分,关系的拆分是信息的回卷,信息的回卷是变体的消除,变体的消除是不确定性的缩减。


深度学习这些“坑”你们有没有踩过(入门误区)_权重_14

自然界两个固有的先验知识:

并行新状态是由若干旧状态并行组合形成。

迭代新状态由已形成的状态再次迭代形成。



应用如何设计网络

  1. 拆分因素:将变体拆分成因素,降低训练所需数据量。
  2. 因素共享:使所拆分的因素在不同的样本之间形成共享,可以用等量的数据训练出更好的模型。

深度学习这些“坑”你们有没有踩过(入门误区)_神经网络_15

每一层表示事物的一种状态,设计神经网络时,要以“层”为单元。

  1. 误区1:深层学习并非万能,应用先验知识的前提是数据可以以先验知识的方式生成
  2. 误区2:深层学习没有固定形式,可以依据上两个要点设计出各式各样的网络。


神经网络变体

循环层:时间共享


深度学习这些“坑”你们有没有踩过(入门误区)_神经网络_16

如果用前馈层,每个圆圈表示100个节点,那么前馈层处理时序相关性时就需要学习300个权重。

但如果知道不同权重在时间下是共享的,那么就只需要学习200个权重。

卷积层:空间共享

深度学习这些“坑”你们有没有踩过(入门误区)_神经网络_17

如果用前馈层,那么需要学习81个权重,但如果知道这些权重在空间下是共享的,那么可能只需要学习9个权重。原本一张图片在前馈层中只能用于学习一次权重,在卷基层中却可以学习很多次。


设计自己的神经网络


深度学习这些“坑”你们有没有踩过(入门误区)_权重_18

​两个方向相加的 双向循环层一般比相并的效果好



  • 神经网络其实并不黑箱,真正黑箱的是你的Task。
  • 设计神经网络就是寻找在你手头的Task上利用因素拆分和因素共享的合理方式
  • 可以先经过前馈层再经过双向循环层再经过前馈层最终得到你的结果。


案例


深度学习这些“坑”你们有没有踩过(入门误区)_权重_19


某些技术


多任务学习muti-task learning,利用的是因素共享,多个任务共享相同的知识,这样就会更容易确定我们真正想要的关联f,而排除掉那些只符合训练数据集,而不符合测试数据集的关联。

joint learningend-to-end learning,是因素共享+因素拆分的联合应用。通过缩减人工预处理和后续处理,尽可能使模型从原始输入到最终输出,给模型更多可以根据数据自动调节的空间,增加模型的整体契合度。


人工智能对我们的影响

深度学习这些“坑”你们有没有踩过(入门误区)_神经网络_20

END

深度学习这些“坑”你们有没有踩过(入门误区)_神经网络_21


计算机视觉战队

最优秀的AI团队

加入我们,一起学习,共同进步!


标签:因素,入门,学习,神经网络,误区,拆分,深度,变体,共享
From: https://blog.51cto.com/u_15726357/6083966

相关文章

  • 深度学习学习合集
    平台已经创办九个月,感谢您一直与我们陪伴,今天我们主要把之前比较好的推送整理一次,希望有兴趣的朋友可以更好的去阅读去学习!首先整理的是综述性的文献,让大家简单明了的进入一......
  • jedis快速入门 String数据结构操作
    jedis一款java操作redis数据库的工具使用步骤下载jedis的jar包  使用获取连接Jedisjedis=newJedis("localhost",6379)操作je......
  • scoped属性和深度选择器
    1.scoped属性的作用:加上scoped属性的作用是---样式只对当前组件有效。对于某个组件,如果style加上scoped属性,即:给当前子组件的结构中都添加上一个data-v-xxx自定义属性,会发......
  • 吴恩达神经网络与深度学习——深度学习引言
    一、深度学习引言1.应用对于图像应用,我们经常在神经网络上使用卷积(ConvolutionalNeuralNetwork),通常缩写为CNN。对于序列数据,例如音频,语言,英语和汉语字母表或单词,......
  • docker swarm快速入门篇
    目录一.dockerswarm集群部署1.初始化manager节点2.worker节点加入集群3.查看集群节点列表4.给节点添加label5.将work节点提升为manager角色以实现高可用6.查看node信息7.......
  • 深度好文:TCP三次握手和四次挥手深入实践
     TCP连接状态 图1是TCP三次握手、数据传输、四次挥手三个阶段的状态转移图,状态说明如下: LISTEN:侦听来自客户端的TCP端口的连接请求SYN-SENT:再发送连接请求后等......
  • Python:Excel自动化实践入门篇 甲【留言点赞领图书门票】
    *以下内容为本人的学习笔记,如需要转载,请声明原文链接微信公众号「englyf」https://mp.weixin.qq.com/s?__biz=MzUxMTgxMzExNQ==&mid=2247485524&idx=1&sn=7af7790002e0e60......
  • Git从入门到实践,掌握现代软件开发必备工具!
    如何学习Git?学习Git需要耐心和练习。通过反复练习和尝试,你将更好地掌握Git的使用。在学习的时候可以参考一下方法! 学习目录:1、了解Git的基本概念Git是一个版本控......
  • Arseed 上传图片 快速入门
    快速入门为了方便开发者入门,我们部署了 web3infra.dev 方便开发者永存数据。快速入门将介绍如何使用arseeding-js将数据存通过 web3infra.dev 存储到Arweave网络......
  • 前端入门
    1.浏览器内核-IE:Trendit-火狐Firefox:gecko-谷歌Chrome:blink-Safari:webkit-Opera:blink2.http超文本传输协议客户端对服务器发送请求报文/服务器对客户端发送......