DIM
  • 2025-01-0825/1/7 算法笔记<强化学习> sac_learn代码拆解
    昨天我们看了V-REP中一个github项目的环境代码,今天我们来分析下他的强化学习代码。git链接:https://github.com/deep-reinforcement-learning-book/Chapter16-Robot-Learning-in-Simulation.首先导入了库importmathimportrandomimportgymimportnumpyasnpimport
  • 2025-01-08【Block总结】CrossFormerBlock
    论文介绍链接:https://arxiv.org/pdf/2108.00154CrossFormerBlock模块提出:论文提出了一种名为CrossFormer的视觉Transformer模型,其中重点介绍了CrossFormerBlock模块的设计。研究背景:针对视觉任务中自注意力模块计算成本高、难以处理跨尺度交互的问题,CrossFormerBlock模块
  • 2025-01-07自注意力self-attention理解(qkv计算、代码)
    1.自注意力的个人理解   self-attention中的核心便是qkv的计算,首先是将输入向量分别乘上三个可学习的的矩阵得到Query(查询)、Key(键)、Value(值);再将q和k点乘达到全局建模的作用,将qk结果进行softmax得到Attention分数;最后将Attention和v相乘这个操作我的理解是:可以把Val
  • 2025-01-07MATLAB的cat函数
    在图像处理中,我们将图像导入MATLAB中,通常以矩阵的形式进行处理;在各种的处理过程中,我们不可避免的要完成对矩阵的拼接,主要分为纵向和横向两种方式。1、横向拼接横向拼接可以考虑使用:“,”或者“空格”;A=[111;222;333];B=[444;555;666];C=[777;888;99
  • 2025-01-07用通俗易懂的方式讲解:大模型面试八股含答案
    今天终于整理好了LLM相关的全流程八股题,共计3w字,有点累的吐血,希望对大家的面试有所帮助基础知识1.transformer八股文这一部分给出之前文章已详细解答了,在你十分清楚transformer结构后,可以加强这些题目来强化对于transformer的理解。当然如果你是一知半解,也可以读来做
  • 2025-01-06【即插即用完整代码】CVPR 2024部分单头注意力SHSA,分类、检测和分割SOTA!
    文章末尾,扫码添加公众号,领取完整版即插即用模块代码!适用于所有的CV二维任务:图像分割、超分辨率、目标检测、图像识别、低光增强、遥感检测等摘要(Abstract)背景与动机:近年来,高效的视觉Transformer(ViT)在资源受限的设备上表现出色,具有低延迟和良好的性能。传统的高效ViT模型
  • 2025-01-05学习随记:word2vec的distance程序源码注释、输入输出文件格式说明
    word2vec中有5个程序,其中demo-word.sh中涉及两个:word2vec、distance。考虑到distance比较简单,所以我从这个入手,希望通过简单代码理解如何在一个高维数据空间计算距离(查找)。一维数据的查找,一般是通过二分法进行比较,找到完全相等的元素。完全相等本质是距离为0.推论,高维词向量
  • 2025-01-05Yolo11改进策略:注意力改进|Neck层改进|SCSA,探索空间与通道注意力之间的协同效应|即插即用
    摘要论文介绍摘要内容:论文提出了一种新的空间与通道协同注意模块(SCSA),旨在通过结合空间注意力和通道注意力,提高各种下游视觉任务的性能。SCSA由可共享多语义空间注意力(SMSA)和渐进通道自注意力(PCSA)两部分组成,通过整合多语义信息并有效引导通道再校准,实现了性能的提升。创新
  • 2025-01-05自学资料 - LoRA - 低秩微调技术
    目录1.微调分类2.LoRA算法全称:Low-RankAdaptation微调的不同类别1.微调分类微调主要分为三类:一种是全参数的微调(类别1)。缺点,如果利用一些较好的优化算法,梯度更新和之前所有的梯度(有历史记忆)都有关啥的会导致占用较多的显存。一种是部分参数微调(可
  • 2025-01-03Word中如何批量合并文件保留格式-VBA代码教学
    Word中如何批量合并文件保留格式-VBA代码教学打开开发工具打开VisualBasic插入模块源码撰写如下如所示点击运行快来试试吧☺️
  • 2025-01-03批量导出ppt中的备注(亲测可用)
    大多数教程采用的是导出大纲的方式,但是博主导出大纲经常失败,于是找到了这篇文章,里面提到了一种新的方法。如何批量导出PowerPoint中的备注到一个txt文本中【最简单最强版】又咨询gpt得到了一个导出word的脚本点击查看代码SubExportNotesToWord()DimpptSlideAsSlide
  • 2024-12-31【论文阅读笔记】SCI算法与代码 | 低照度图像增强 | 2022.4.21
    目录一SCI1SCI网络结构核心代码(model.py)2SCI损失函数核心代码(loss.py)3实验二SCI效果1下载代码2运行一SCI
  • 2024-12-31SQL实现报表功能
    查询查询按钮点击事件脚本//查询功能:SubOnClick(ByValItem)Dimconn'定义类对象DimSCon'定义数据库连接字符串DimoRs1'定义获取到的数据集DimoComDimstrSQL1Dimm,i,j,k'---------------------
  • 2024-12-26(即插即用模块-特征处理部分) 十六、(AAAI 2023) WavePooling 波叠加启发池化
    文章目录1、WavePooling2、代码实现paper:WSiP:WaveSuperpositionInspiredPoolingforDynamicInteractions-AwareTrajectoryPredictionCode:https://github.com/Chopin0123/WSiP1、WavePooling论文先分析了目前在轨迹预测领域的一些问题,即现有的轨迹预
  • 2024-12-24YOLO11改进-模块-引入空间自适应特征调制网络SAFMN(Spatial Adaptive Feature Modulation Network)
            尽管基于深度学习的解决方案在图像超分辨率(SR)中取得了令人瞩目的重建性能,但这些模型通常较大且架构复杂,使其与许多具有计算和内存限制的低功耗设备不兼容。为了克服这些挑战,我们提出了一种用于高效SR设计的空间自适应特征调制(SAFM)机制。具体来说,SAFM层使用
  • 2024-12-19【NLP 16、实践 ③ 找出特定字符在字符串中的位置】
    看着父亲苍老的白发和渐渐老态的面容希望时间再慢一些                                                ——24.12.19一、定义模型1.初始化模型①初始化父类super(TorchModel,self).__init__(): 调用父类nn.Mod
  • 2024-12-17空间三点求圆心程序设计及实现【vb.Net】
    已知空间三点的三维坐标,求这三个点所确定的空间圆的圆心坐标和半径。这是测绘领域经常会碰到的问题,今天示例关于这个空间三点求圆心程序的实现过程。1、基础理论——空间三点确定圆心已知空间三点的坐标为(x1,y1,z1),(x2,y2,z2),(x3,y3,z3),求这三个点所确定的空间圆的圆心坐标和
  • 2024-12-15B4X编程语言:B4X字符串生成器StringBuilder
            SQL查询字符串、B4J控件的Style属性字符串等有时候会很长,不但影响代码结构的可读性,而且易出错、不方便输入和维护。我们通常会拆分为两个或多个字符串变量,输入后再连接合并使用。        B4X为我们提供了一个很好用的字符串操作对象:StringBuilder字符
  • 2024-12-13转载:【AI系统】MobileVit 系列
    自VisionTransformer出现之后,人们发现Transformer也可以应用在计算机视觉领域,并且效果还是非常不错的。但是基于Transformer的网络模型通常具有数十亿或数百亿个参数,这使得它们的模型文件非常大,不仅占用大量存储空间,而且在训练和部署过程中也需要更多的计算资源。所以在本
  • 2024-12-13转载:【AI系统】MobileVit 系列
    自VisionTransformer出现之后,人们发现Transformer也可以应用在计算机视觉领域,并且效果还是非常不错的。但是基于Transformer的网络模型通常具有数十亿或数百亿个参数,这使得它们的模型文件非常大,不仅占用大量存储空间,而且在训练和部署过程中也需要更多的计算资源。所以在本
  • 2024-12-13转载:【AI系统】EfficientFormer 系列
    本文主要介绍一种轻量化的Transformer结构,在获得高性能的同时,能够保持一定的推理速度。以延迟为目标进行优化设计。通过延迟分析重新探讨ViT及其变体的设计原则。EfficientFormerV1模型EfficientFormerV1:基于ViT的模型中使用的网络架构和具体的算子,找到端侧低效的原因
  • 2024-12-13转载:【AI系统】MobileVit 系列
    自VisionTransformer出现之后,人们发现Transformer也可以应用在计算机视觉领域,并且效果还是非常不错的。但是基于Transformer的网络模型通常具有数十亿或数百亿个参数,这使得它们的模型文件非常大,不仅占用大量存储空间,而且在训练和部署过程中也需要更多的计算资源。所以在本
  • 2024-12-11论文解读-Graph neural networks: A review of methods and applications
     论文介绍这篇论文是图神经网络领域的综述性质的文章,从各个论文里面凝聚和提取了很多精炼的信息和观点,值得一读。论文是2020年成稿投出去的,有点陈旧的。 GNN的介绍在introduction里面对比了GNN和CNN,表示出CNN的关键是局部连接,共享权重,和多层的使用。其中CNN操作的是常规
  • 2024-12-10一键排监考表!我的任务丸橙辣!
    要求1、可变动的:监考总人数、每人监考次数、科目、考场;2、不可变的:每场2个人监考、每人能监考≤最大次数、每人每科目只有一场;3、必须有的:生成一张表显示监考安排结果、生成一张表统计每位老师的每一科目监考情况和总数);4、其他要求:尽量简化操作、尽量让每次使用需要的改动简
  • 2024-12-09【论文系列】PPO知识点梳理 (尽我可能细致通俗理解!)
    零、题记这篇博客一方面为了记录当前的知识点,另一方面PPO算法实在是太重要了,不但要从理论上理解它到底是怎样实现的,还需要从代码方面进行学习和记录,这里我就通俗的将这个知识点进行简单的记录,用来日后我自己的巩固和大家的交流学习。下面均是我自己个人见解,如有不对之处,欢迎评论