• 2024-11-20深入解析 ResNet:实现与原理
    ResNet(ResidualNetwork,残差网络)是深度学习领域中的重要突破之一,由KaimingHe等人在2015年提出。其核心思想是通过引入残差连接(skipconnections)来缓解深层网络中的梯度消失问题,使得网络可以更高效地训练,同时显著提升了深度网络的性能。本文以一个ResNet的简单实现为例,详细
  • 2024-11-18RT-DETR融合针对小目标FFCA-YOPLO中的FEM模块及相关改进思路
    RT-DETR使用教程: RT-DETR使用教程RT-DETR改进汇总贴:RT-DETR更新汇总贴《FFCA-YOLOforSmallObjectDetectioninRemoteSensingImages》一、模块介绍    论文链接:https://ieeexplore.ieee.org/document/10423050    代码链接:yemu1138178251/
  • 2024-11-18YOLOv11融合针对小目标FFCA-YOPLO中的FEM模块及相关改进思路
    YOLOv11v10v8使用教程:  YOLOv11入门到入土使用教程YOLOv11改进汇总贴:YOLOv11及自研模型更新汇总 《FFCA-YOLOforSmallObjectDetectioninRemoteSensingImages》一、模块介绍    论文链接:https://ieeexplore.ieee.org/document/10423050   
  • 2024-11-02神经网络中间层输出
    测试中间层输出importtorchimportnumpyasnpfromPILimportImagefromtorchvisionimporttransforms,modelsimportmatplotlib.cmfromtorchinfoimportsummaryimportcopyimportcv2importmatplotlib.pyplotaspltdevice='cuda'iftorch.cuda.is_
  • 2024-10-30YOLO(You Only Look Once)目标检测系列 - YOLOv1
    今天开始更新YOLO系列的文章,并且配套详细的代码,供大家使用。YOLO(YouOnlyLookOnce)目标检测系列-YOLOv1一、引言YOLO(YouOnlyLookOnce)是一个高效的目标检测系统,能够在单次前向传递中检测图像中的多个对象。它在速度和准确性之间取得了良好的平衡,适合于实时应用。本
  • 2024-10-16【TVM 教程】规约(reduce)
    ApacheTVM是一个端到端的深度学习编译框架,适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者:TianqiChen本文介绍如何在TVM中规约(reduce)。关联规约算子(如sum/max/min)是线性代数运算的典型构造块。from__future__importabso
  • 2024-10-14笨方法实现resnet18
    importtorchclassmyResNet(torch.nn.Module):def__init__(self,in_channels=3,num_classes=10):super(myResNet,self).__init__()#第1层self.conv0_1=torch.nn.Conv2d(in_channels,64,kernel_size=7,stride=2,padding=3)
  • 2024-10-04征程6 NV12 理论与代码详解
    1.引言使用地平线征程6算法工具链进行模型部署时,如果你的模型输入是图像格式,通常会遇到如下信息。对于初学者,可能会存在一些疑问,比如:nv12是什么?明明算法模型是一个输入,为什么看hbm模型,有y和uv两个输入?为什么uv的validshape不是(1,224,224,2),而是(1,112,112,2)s
  • 2024-09-30yolov5视频流实时检测实现
    yolov5https://github.com/ultralytics/yolov5 对rtsp视频流的支持https://github.com/ultralytics/yolov5/blob/master/detect.py @smart_inference_mode()defrun(weights=ROOT/'yolov5s.pt',#modelpathortritonURLsource=ROOT/�
  • 2024-09-28卷积、激活、池化与批量归一化:深度学习中的关键操作
    在深度学习,尤其是卷积神经网络(CNN)中,卷积、激活、池化和批量归一化是四个基本操作。它们共同作用,帮助模型高效学习和提取数据中的重要特征。1.卷积操作作用卷积操作旨在通过滑动卷积核(过滤器)在输入数据上提取局部特征,如边缘和角点。过程滑动卷积核:卷积核在输入特征图上
  • 2024-09-19卷积和转置卷积的输出尺寸计算
    卷积和转置卷积的输出尺寸计算卷积h'是输出的高,h是输入的高,k_h是卷积核的高w类似stride=1h'=h-k_h+padding*2+1通用公式stride=1就是上面的公式h'=(h-k_w+2*padding+stride)//stride一些常见的卷积高宽不变的卷积:kernel_size=3,padding=1,这
  • 2024-08-20limu|P19-22|卷积神经网络(CNN)基础
    目录:1、卷积是什么:在数学、实际生活、数字图像处理和机器学习中的卷积2、卷积层是什么:从全连接层到卷积层3、卷积层的kernal_size、padding、stride等超参数4、卷积层的输入和输出的通道数(in_channels和out_channels)的意义5、池化层参考资料:1、李沐动手学深度学习课程2、b
  • 2024-08-04模型轻量化——知识蒸馏(一)
    写作目的:帮助新手快速掌握人工智能中模型轻量化部分的内容。知识蒸馏原理:训练一个参数量较大的模型(教师模型),然后用其输出来帮助参数量较小的模型(学生模型)进行训练,以达到提升精度的目的。代码实现:模型构建首先先使用pytorch创建一个简单的模型,该模型参数较少,当作学生模型
  • 2024-08-03常用的数据集WebVision介绍和pytorch下的简单使用
    WebVision数据集介绍官方下载地址WebVision数据集常用于开集/闭集噪声学习、长尾噪声学习方法在真实数据集上的评估。根据[2]的统计,干净样本占70%,OOD噪声占25%,ID噪声占5%。由于数据集本身较大,论文中使用的都是其中很小的一部分,进入下载页面,选择《WebVisionDataset1.0》《Resi
  • 2024-07-27经典CNN模型(九):MobileNetV3(PyTorch详细注释版)
    一.MobileNetV3神经网络介绍MobileNetV3是MobileNet系列的第三代模型,由Google在2019年提出,旨在进一步优化模型的效率和性能,特别是在移动设备和边缘计算设备上。与前一代相比,MobileNetV3引入了多项改进,包括使用神经架构搜索(NeuralArchitectureSearch,NAS)、自适
  • 2024-07-24神经网络中常用的函数
    1、激活函数:F.relu(x):ReLU(RectifiedLinearUnit)激活函数,将输入 x 的所有负值置为0,正值保持不变。F.sigmoid(x):Sigmoid激活函数,将输入 x 映射到(0,1)区间。F.tanh(x):双曲正切激活函数,将输入 x 映射到(-1,1)区间。2、池化函数:F.max_pool1d(input,ker
  • 2024-07-19TransReID模型运行
    模型源码可通过下方链接进行下载,相应的数据集也可以通过下方链接找到并下载。https://github.com/damo-cv/TransReID?tab=readme-ov-file1.环境配置pipinstall-rrequirements.txt通过以上指令安装好所需要的包。2.预训练模型下载在源码下载页面,找到图片所示位置进行
  • 2024-07-146-1构建模型的3种方法
    可以使用以下三种方式构建模型:1.继承nn.Module基类构建自定义模型2.使用nn.Sequential按层顺序构建模型3.继承nn.Module基类构建模型并辅助应用模型容器进行封装(nn.Sequentail,nn.ModuleList,nn.ModuleDict)其中第一种方式最为常见,第二种方式最简单,第三种方式最为灵活也较为
  • 2024-07-01经典的卷积神经网络模型 - AlexNet
    经典的卷积神经网络模型-AlexNetflyfishAlexNet是由AlexKrizhevsky、IlyaSutskever和GeoffreyHinton在2012年提出的一个深度卷积神经网络模型,在ILSVRC-2012(ImageNetLargeScaleVisualRecognitionChallenge2012)竞赛中取得了显著的成果,标志着深度学习在计
  • 2024-07-01经典的卷积神经网络模型 - VGGNet
    经典的卷积神经网络模型-VGGNetflyfishVGG网络的名称来源于其开发团队——牛津大学的视觉几何组(VisualGeometryGroup)在2014年,牛津大学的视觉几何组和GoogleDeepMind公司的研究人员也不例外,研发了一个名为VGG的网络,VGG网络的一个主要贡献是展示了网络的深度(即层数)在
  • 2024-06-11STRIDE威胁模型
    一,概述STRIDE分析模型是微软提出的一种威胁建模方法,它也是一套安全设计的方法论,它的6个字母代表六种安全威胁。分别是: 身份欺骗(Spoofing)身份欺骗,即伪装成某对象或某人,指违背用户的认证信息。攻击者获得了用户的个人信息或使它能够重放认证过程的东西。例如,通过伪装成别人的
  • 2024-05-22STRIDE模型应用于信息安全威胁分析学习
    STRIDE模型应用与信息安全威胁分析学习一、引言功能安全风险分析是对系统的系统性失效和随机性失效进行风险评估,对于网络安全风险,需要通过威胁分析识别系统的威胁场景,用于形成有对应威胁的控制措施和有效的分层防御,威胁分析是信息安全风险分析的重要组成部分。二、威胁分析的步
  • 2024-05-19OpenVX代码优化裁减简介
    OpenVX代码优化裁减简介 在OpenVX中,裁减(Reduction)是一种操作,它对数组或图像中的元素执行聚合操作。这里的“裁减”是指将大型数组或图像减少到单一数值的过程。OpenVX提供了几种不同的裁减操作,包括求和(Summation)、平均(Average)、最小值(Minimum)、最大值(Maximum)和累加器(Accumulat
  • 2024-05-06动手学深度学习——卷积操作
    卷积卷积概念卷积原属于信号处理中的一种运算,引入CNN中,作为从输入中提取特征的基本操作补零:在输入端外侧填补0值使得卷积输出结果满足某种大小,在外侧的每一边都添加0值,使得输出可以达到某种预定形状跨步:卷积核在输入上滑动时每次移动到下一步的距离使用张量实现卷积impor
  • 2024-05-02ResNet代码精读
    classBasicBlock(nn.Module):expansion=1def__init__(self,in_channel,out_channel,stride=1,downsample=None,**kwargs):#虚线对应的downsamplesuper(BasicBlock,self).__init__()self.conv1=nn.Conv2d(in_channels=in_channel,ou