首页 > 其他分享 >深度学习入门

深度学习入门

时间:2024-09-28 17:23:27浏览次数:12  
标签:机器 入门 卷积 学习 感知机 神经网络 深度

目录

深度学习定义

深度学习的发展背景

神经网络基础

深度学习与传统机器学习的关系


深度学习定义

     深度学习是机器学习的一个分支,它模仿人脑处理数据和创建模式的方式,用于解决复杂的模式识别问题。与传统的机器学习方法相比,深度学习能够自动从原始数据中学习到更高层次的特征表示,而无需人为地进行特征工程。这种能力主要得益于其核心架构——深层神经网络,它由多层非线性变换组成,每一层都负责提取输入数据的不同抽象级别的特征。

在深度学习模型中,信息通过一系列连续的层被处理,这些层可以包括卷积层、池化层、全连接层等不同类型。随着层数的增加,模型可以从简单的边缘检测逐步发展为更复杂的形状和对象识别。这使得深度学习特别适合于图像识别、语音识别、自然语言处理等领域,在这些领域内,深度学习已经取得了超越人类水平的表现。

深度学习的发展背景

    深度学习的历史可以追溯到20世纪40年代关于人工神经网络的研究。但是直到近年来,由于计算资源的进步(特别是GPU)、大数据集可用性的提高以及算法上的创新,才真正推动了深度学习技术的大规模应用与发展。几个关键里程碑如下:

年份事件/技术描述影响
1943麦卡洛克-皮茨神经元模型提出了第一个数学模型,模仿生物神经元的工作方式。奠定了人工神经网络理论基础。
1958感知机弗兰克·罗森布拉特发明了感知机,这是最早的可训练的人工神经网络之一。展示了机器可以通过简单规则从数据中学习。
1969Minsky & Papert的批评在《Perceptrons》一书中指出单层感知机无法解决XOR问题等局限性。导致了第一次AI寒冬,减缓了神经网络的研究。
1970s-1980s多层感知机与反向传播Paul Werbos提出反向传播算法;Rumelhart, Hinton, Williams等人重新发现并推广了这一方法。允许训练深层网络,解决了多层神经网络的学习问题。
1989卷积神经网络 (CNN) 的概念Yann LeCun提出了LeNet-5,这是一种用于手写数字识别的卷积神经网络架构。开启了计算机视觉的新时代。
1990s支持向量机 (SVM) 的兴起Vladimir Vapnik等人开发的支持向量机在许多任务上表现优异,使得神经网络研究暂时退居二线。减少了对复杂神经网络的需求,直到更大规模的数据集变得可用。
2006深度信念网络 (DBN)Geoffrey Hinton及其团队提出了无监督预训练的方法,有效初始化深层网络权重。标志着现代深度学习时代的开始。
2012AlexNet在ImageNet大规模视觉识别挑战赛(ILSVRC)上取得了显著胜利,比第二名高出10.8%的准确率。证明了深层卷积神经网络在图像分类中的强大能力。
2014GoogLeNet (Inception)Google团队提出的GoogLeNet引入了Inception模块,进一步提高了图像识别精度。推动了更复杂的网络架构设计。
2015Residual Networks (ResNets)Kaiming He等人提出残差连接的概念,允许构建非常深的网络而不损失性能。解决了梯度消失问题,使数百甚至数千层的网络成为可能。
2017Transformer模型Vaswani et al.发表了“Attention is All You Need”,介绍了一种基于自注意力机制的序列建模新方法。对自然语言处理(NLP)产生了革命性影响。
  • 1958年:弗兰克·罗森布拉特提出了感知机模型,这是第一个能够学习简单分类任务的人工神经网络。
  • 1986年:杰弗里·辛顿等人引入反向传播算法,解决了训练多层神经网络时梯度消失的问题,为后来深度学习的发展奠定了基础。
  • 2006年:辛顿提出了一种有效的无监督预训练方法来初始化深层网络权重,开启了现代深度学习时代。
  • 2012年:AlexNet在ImageNet竞赛中的胜利标志着基于CNNs(卷积神经网络)的方法成为视觉识别任务的标准解决方案之一。

自那以后,随着硬件加速器如NVIDIA GPU的支持以及开源软件库如TensorFlow, PyTorch等的发展,深度学习开始广泛应用于各行各业,并持续推动着人工智能领域的进步。

神经网络基础

神经网络是由多个节点或“神经元”组成的计算模型,旨在模拟生物大脑的工作方式。每个神经元接收来自前一层的输入信号,通过加权求和后加上偏置项,并经过激活函数处理输出结果。常见的激活函数有Sigmoid、ReLU (Rectified Linear Unit) 和 Tanh 等。整个过程可以用数学公式表示为

标签:机器,入门,卷积,学习,感知机,神经网络,深度
From: https://blog.csdn.net/weixin_43298211/article/details/142604011

相关文章

  • vulnhub入门靶场:basic_pentesting
    靶机下载链接:https://download.vulnhub.com/basicpentesting/basic_pentesting_1.ova一、环境安装双击下载好的.ova文件即可在VMware上打开网卡这里确保与kali使用同一网卡,处于同一网段二、信息收集先确定kali的ip:192.168.231.133扫描一下靶机的ip:192.168.231.196ar......
  • 《2024 Java 就业前景深度洞察报告》
    《2024Java就业前景深度洞察报告》一、核心观点1.1Java就业前景光明,持续引领技术潮流Java作为一种广泛应用于软件开发的编程语言,在当今的技术领域中占据着重要地位。它具有强大的跨平台性、稳定性和安全性,使得众多企业在开发关键业务系统时首选Java。随着信息技术......
  • d2l-ai深度学习日记(四)-深度学习计算
    前言:这个博客《d2l-ai深度学习日记》将记录我在深度学习领域的学习与探索,特别是基于《动手学深度学习》这本经典教材的学习过程。在这个过程中,我不仅希望总结所学,还希望通过分享心得,与志同道合的朋友一起交流成长。这不仅是对知识的沉淀,也是我备战研究生考试、追逐学术进阶之......
  • d2l-ai深度学习日记(三)-多层感知机
     前言:这个博客《d2l-ai深度学习日记》将记录我在深度学习领域的学习与探索,特别是基于《动手学深度学习》这本经典教材的学习过程。在这个过程中,我不仅希望总结所学,还希望通过分享心得,与志同道合的朋友一起交流成长。这不仅是对知识的沉淀,也是我备战研究生考试、追逐学术进阶......
  • Redis学习笔记
    一、Redis简介1.1NOSQLNoSQL(NoSQL=NotOnlySQL),意即“不仅仅是SQL”,是一项全新的数据库理念,泛指非关系型的数据库。随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型,web2.0纯动态网站已经显得力不从心,暴露了很多难以克服......
  • Pulsar 入门实战(4)--命令行使用
    本文主要介绍Pulsar的命令行使用,相关的环境及软件信息如下:CentOS7.9.2009、Pulsar3.3.0、Java17.0.10。1、环境配置在 conf/client.conf中配置Pulsar相关地址:webServiceUrl=http://10.49.196.30:8080,10.49.196.31:8080,10.49.196.32:8080brokerServiceUrl=pulsar:/......
  • CMake构建学习笔记18-cpp-httplib库的构建
    cpp-httplib库是笔者认为的一个比较好用的基于C++的Http服务器组件,与Eigen一样,它也是基于头文件的库,我们只需要引入httplib.h这个头文件进行来就实现所有基于http/https协议的功能,非常适合初学者进行使用。尽管是头文件,还是可以使用CMake进行构建,便于统一管理,关键脚本如下:#配置......
  • 【机器学习】ID3、C4.5、CART 算法
    目录常见的决策树算法1.ID32.C4.53.CART决策树的优缺点优点:缺点:决策树的优化常见的决策树算法1.ID3ID3(IterativeDichotomiser3)算法使用信息增益作为特征选择的标准。它是一种贪心算法,信息增益表示按某特征划分数据集前后信息熵的变化量,变化量越大,表示使用该......
  • sql学习笔记
    DDL各种数据类型mysql数据类型decimal参考:https://blog.csdn.net/qq_38228254/article/details/88374713decimal(a,b) a指定小数点左边和右边可以存储的十进制数字的最大个数,最大精度38。 b指定小数点右边可以存储的十进制数字的最大个数。小数位数必须是从0到a之间......
  • RISC-V学习笔记
    文档介绍:https://www.cnblogs.com/mikewolf2002/p/9654946.html中文手册:http://crva.ict.ac.cn/documents/RISC-V-Reader-Chinese-v2p1.pdf所有立即数都被拓展成32位。opcode指定总体功能,同时决定了指令格式。funct指定了具体的小功能。压缩指令集......