对于学习,我们一直有几个观点。
(1) 学习必须是系统和完整的。目前短视频时代最大的问题就是信息的碎片化,在不断更新的信息下我们很容易被带入浮躁的学习氛围中,但学习的目标是为了长期使用,那么必然需要系统性地掌握知识,往后才能够触类旁通。短期突击(如单个项目)或许可以通过测试,但是终究用处有限,而且迟早会暴露残缺的知识背景。学习是一个非常复杂的高维认知行为,因此学习资料形式最好也是包含各种形式,最好包含视频和图文,理论与实践兼具,囊括线上和线下交流,这样能够满足各类人群的需求,方便及时反馈问题。
(2) 学习必须是长期和动态的。本行业的特点是技术迭代更新确实非常快,因此要保持长期的学习习惯,几个月的固定学习周期是不够的,这只能初窥门道。学习资料是死的,人是活的,源源不断的问题根本就不是资料,尤其是录制好的音视频能解决的,因此我们要保证长年累月的交流渠道是畅通的,必须要有一个长期学习的技术圈子。
(3) 学习必须要完成闭环。学习的目标不是为了学习,而是为了使用。从掌握知识,到后续积累人脉和项目经历,甚至完成学生到老师的转变,越往后越有价值。我希望跟着我们学习的同学,能够持续在生态中获益,成为专栏/书籍作者,成为老师,成为项目负责人,甚至是合伙人。
基于此,我们在几年前开始推出季划的学习模式,就是为了让大家能够得到全方位的锻炼,下面是一些有三AI季划成员的分享,供大家参考:
除了非常系统性的学习资料之外,季划的重点在于解决几个问题,这也是其他机构不可能承诺的。
(1) 永久有效。没有一家以运营为核心竞争力的公司可以承诺永久有效,甚至很多的机构本来就只能在特定的学习区间内进行学习,只有本来就一直在从事这一行技术研发,并且保持学习的机构才可能做到永久维护相关社群。很多这几年突飞猛进的商业公司的目标是在追逐风口中最大化利润,自身团队就很不稳定,人员变动频繁,如何做到永久有效?
(2) 内容保持更新。大家应该能看到我们的课程内容过一段时间就会翻新,不仅仅是随着技术更新增加新内容,已有的内容也会进行优化,这在其他商业机构中是不存在的,因为回报太低,而且可能一个讲师更新完课程后,就不会继续再和机构进行合作了,如何保持更新?即便有更新后也需要再次付费,而我们的内容是一直保持更新,更新后也不会重复收费。
(3) 一对一随时答疑。对于季划成员的提问,我没有限定大家的提问时间,任何时候都有可能在回答问题,有文字有语音甚至是线下,每天都有不少时间的支出,而且是一对一的,这在其他地方可能做到吗?当然了,人力有穷时,有些问题不一定能解决,有的时候时间也不方便,相信大家也可以理解。但是,凡是提问,必有回应。
(4) 真实企业项目。相信大家也看到很多机构包装的企业级项目,但几乎100%都是假的。什么是企业级项目?只有在公司做的,反复迭代的,最终用于产品上线的,才能称之为企业级项目。企业级项目的核心并不在于难度,而在于迭代与打磨。我们是有公司的,官网地址为https://yousanai.com/index,公司有研发组,有B端和C端的项目。
目前参与过公司项目的已经有几十个成员,上面的成员分享中就有一些,大家在里面可以保持关注,我们无法保证大家都能做到自己想做的项目,但起码是一直有需求在进入,这在一些绝大部分成员都是运营小姐姐的培训机构能做到吗。
这就是我们的学习模式,希望产学研结合,这不仅利于学习者,也是利于我们生态的,做了几年后也得到了大家的认可。目前我们有1个夏季划小组,4个秋季划小组,1个冬季划小组,对于绝大多数朋友来说,夏季划是最合适的小组,因此下面我们给大家介绍一下有三AI-CV夏季划。
什么是有三AI-CV夏季划
现在已经是2022年夏天了,我们有三AI-CV夏季划正在进行中,有三AI-CV夏季划是我们当前最系统最重要的深度学习和计算机视觉学习计划小组,目标是在新手入门的基础之上,彻底掌握好CV的重要方向,同时提升模型设计与优化的工程代码经验,当前已经有超过200个小时,10多个专业方向,30多个项目的内容。
完整介绍可看下面的视频:
下图是2022年CV夏季划包括的所有内容预览图,可以自行放大仔细阅读。
学习内容覆盖以下几个部分:
(1) 编程基础,包括C++使用,Caffe等框架的完整源代码解读与定制,开源框架Pytorch的使用。
(2) 数据使用,包括数据获取,数据整理,数据标注,数据增强。
(3) 计算机基础方向深入掌握,包括图像分类,图像分割,目标检测与跟踪,人脸图像检测与识别,图像生成GAN,视频分类与行为识别。
(4) 模型设计与优化深入掌握,包括模型分析,模型设计,模型优化。
(5) 3本书,包括《深度学习之图像识别》,《深度学习之模型设计》,《深度学习之人脸图像处理》。
学习资源包括以下部分:
(1) 3本图书教材。
(4) 一些有趣的资料,比如学习扑克牌卡片(数量有限,送完即止)。
(5) 有三AI项目研发组,持续发布各类真实的企业研发项目。
(6) 有三AI项目内容组,包括针对B端与C端的图文与视频内容输出。
编程与开源框架部分
C++是项目落地的关键,我们需要熟练使用基本库,计算机视觉相关库,掌握高效的编程习惯,学会编写CMake和Makefile编译文件,会配置若干个小任务和1个综合性任务。
Caffe是一个非常适合提高C++与CUDA编程能力,熟悉开源框架开发的框架,需要掌握源代码解读,修改与模型部署(C++接口),掌握Caffe的设计思想,核心代码解读,学会Caffe代码的自定义与修改,学会使用C++接口进行模型部署。
Pytorch是当下最流行的深度学习开源框架,夏季划所有的项目都是使用Pytorch框架,因此是我们必须要掌握的内容,夏季划配置了一套5个小时的Pytorch课程。
数据使用
数据的使用是深度学习算法领域从业者的必备素质,需要掌握如何收集高质量的数据,如何整理数据,如何分析数据,如何在各类项目中使用好数据增强。我们配置了1门时长超过3小时的《深度学习之数据使用》课程与若干个项目实践。
图像分类
对于刚接触深度学习计算机视觉的初学者来说,图像分类问题是最常见的问题,如何做好图像分类任务,关系到大家能否正确顺利地入门。夏季划配置了1门超过12个小时的《深度学习之图像分类》课程与5个项目实践。
理论部分:涵盖了深度学习之图像分类的各个研究方向,如图像分类简介、多类别图像分类、细粒度图像分类,多标签图像分类,弱监督图像分类,零样本图像分类等,既有足够的宽度,也具备有足够的深度。
实践部分:一共已经包含了5个实践案例,分别为人脸表情分类实战,简单分类任务数据增强实战,鸟类细粒度分类实战,生活用品多标签图像分类实战,基于血红细胞的图像分类竞赛技巧,从5大方向基于Pytorch实战来详解图像分类任务实践。
图像分割
图像分割在直播,电商,自动驾驶等行业中有着广泛的应用,夏季划配置了1门超过14个小时的《深度学习之图像分割-理论实践篇》课程。
理论部分:涵盖了深度学习之图像分割的各个研究方向,如图像分割基础、语义分割、弱监督语义分割,Image Matting,实例分割等,既有足够的宽度,也具备有足够的深度。
实践部分已经包含了4个实践案例,分别为人脸嘴唇分割实战,缺陷分割实战,Image Matting人像抠图实战,Mask RCNN实例分割实战,后续可能还会增加其他方向的实战。
目标检测
目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。夏季划配置了《深度学习之目标检测》系列课程,已完成超过30小时的理论课与实践课程,并还将继续更新。
(1) 理论部分内容包括:two-stage算法-Faster RCNN系列详解、one-stage算法-YOLO系列详解(从YOLO v1到YOLO v5),Anchor-free算法系列详解(包括Densebox,CenterNet,CornetNet等);会非常详细地讲解算法中的细节,帮助彻底消化算法原理;
(2) 实践部分内容包括: YOLOv3实战(工业缺陷检测)、Faster-RCNN实战(猫脸检测),CenterNet(电路板缺陷检测),MMdetection框架使用;基于Pytorch框架进行实战,逐行剖析代码,完全掌握实战细节;
模型分析、设计与优化
好的模型结构是深度学习成功的关键因素之一,不仅是非常重要的学术研究方向,在工业界实践中也是模型是否能上线的关键。对各类底层深度学习模型设计和优化技术理解的深度是决定我们能否在深度学习项目中游刃有余的关键,夏季划配置了3门对应的视频课程。
第1门是《深度学习之模型分析-理论实践篇》,内容涵盖了深度学习模型可视化,复杂度分析,速度分析,总计超过3个小时。
第2门是《深度学习之模型设计-理论实践篇》:内容包含有网络深度与模型性能、网络宽度与模型性能、注意力机制、轻量化网络、安卓部署5个部分,总共时长超过20个小时:
理论部分内容如下,包括:
(1) 网络深度与模型性能主要包含:经典浅层卷积网络的设计、网络深度对分类模型的影响;
(2) 网络宽度与模型性能主要包含:经典模型的宽度设计思想、网络宽度对模型性能影响;
(3) 注意力机制主要包含:空间注意力模型、通道注意力模型、 混合注意力模型、项目实战;
(4) 轻量化网络理论主要包含:Xception网络、MobileNet V1和V2网络、 ShuffleNet V1和V2网络、SqueezeNet网络;
实践部分内容如下,包括:
(1) 基于MobileNet的网络深度设计分析及实战;
(2) 基于XceptionNet的网络宽度设计分析及实战;
(3) 基于SeNet的人种分类实战;
(4) 基于Pytorch的安卓端模型部署。
第3门是《深度学习之模型优化-理论实践篇》:内容包含模型剪枝,模型量化,模型蒸馏,模型压缩框架4个部分,总共时长超过10个小时:
目前已经包含有模型剪枝,模型量化,模型蒸馏理论与实践。
同时与本课程相关的还有有三AI知识星球中的各类模型优化模块,形式是相关论文的图文解读。
星球介绍可见:【杂谈】有三AI知识星球指导手册出炉!和公众号相比又有哪些内容?
图像生成GAN
GAN的研究和应用在这几年发展可以说是非常迅猛,已经被用于各个研究方向,其应用涉及图像与视频生成,数据仿真与增强,各种各样的图像风格化任务,人脸与人体图像编辑,图像质量提升。其中GAN最早期也是最经典的任务,就是高质量图像生成,当前已经可以生成1024分辨率以上的高清逼真图像,夏季划配置了《深度学习之图像生成GAN》课程。
本课程理论部分内容包括图像生成的各个经典算法与实践,时长超过5个小时,理论与实践内容非常丰富。详细解读了基本的卷积GAN,各类条件生成GAN,强大的StyleGAN系列,数据增强与仿真GAN,后续还会增加3D与视频的部分内容,既有足够的宽度,也具备有足够的深度。
本次课程中一共已经包含了2个Pytorch实战案例,分别为DCGAN人脸嘴唇表情生成任务,StyleGAN人脸图像生成任务,后续还会增加3D与视频部分的实践内容。
课程详情可见:【视频课】生成对抗网络经典任务,详解基于GAN的图像生成算法!
人脸图像检测与识别
人脸与人像是整个计算机视觉领域中最重要的图像,夏季划配置了《深度学习之人脸检测与识别》课程。
理论部分涵盖了人脸检测、关键点检测、人脸识别、人脸属性识别等内容,实践包括了人脸检测,人脸识别,人脸表情识别3个案例。
课程详情可见:【视频课】13小时+3大项目掌握深度学习人脸图像检测与识别
视频分类与行为识别
随着图像识别相关领域的研究与应用逐渐成熟,当下视频分析相关的研究和应用所占比例越来越大,其技术也更加复杂。视频分类和行为识别在视频监控与检索、网络直播、推荐系统等行业中有着广泛的应用,是深度学习在视频分析领域中最底层的问题之一,非常值得关注和学习。夏季划配置了《深度学习之视频分类与行为识别》课程。
本课程理论部分内容涵盖了深度学习之视频分类的主要模型,如3D卷积模型,双流模型,RNN时序模型等,既有足够的宽度,也具备有足够的深度。我们会非常详细地讲解算法中的细节,帮助彻底消化算法原理。
本次课程中一共已经包含了3个Pytorch实战案例,分别为3D卷积模型视频分类实战,CNN-LSTM时序模型分类实战,双流模型分类实战。
课程详情可见:【视频课】8小时系统性地掌握深度学习视频分类与行为识别理论+实践
深度学习基础
最后,对于初学者来说,可能深度学习的基础不够夯实,有三之前给阿里云开发了《深度学习原理与实践》的基础课程,共38个课时,讲述了深度学习的大部分基础内容,内容深度和宽度都足够让初学者掌握好深度学习基础,介绍和地址如下: