• 2024-10-15CVPR 2024论文与代码汇总:计算机视觉领域最新研究进展
    CVPR2024论文与代码汇总:计算机视觉领域最新研究进展计算机视觉与模式识别会议(CVPR)作为计算机视觉领域最具影响力的学术会议之一,每年都会吸引全球顶尖研究机构和企业提交大量高质量论文。CVPR2024即将于今年6月在美国西雅图举行,目前已经公布了部分接收论文名单。本文将对CV
  • 2024-10-15cvpr注意事项和注册流程(2025版)(20241015更新还未开放注册)
    本文章基于现有网上没有cvpr详细版本的一步一步的注册流程进行编写,用于指导自己和方便他人进行注册。接下来将从CVPR2025的重要节点、变更事项、注册流程进行说明重要节点CVPR2025变更的重要事项Duetothedramaticincreaseinthenumberofsubmissionsandthedeterio
  • 2024-10-14CVPR-2024-卫星遥感图像相关论文 16篇
    CVPR-2024-卫星遥感图像相关论文16篇GeoChat:GroundedLargeVision-LanguageModelforRemoteSensing文章解读:http://www.studyai.com/xueshu/paper/detail/00ffce4794文章链接:(https://openaccess.thecvf.com/content/CVPR2024/html/Kuckreja_GeoChat_Grounde
  • 2024-09-26ShiftAddAug:基于乘法算子训练的最新无乘法网络方案 | CVPR'24
    不包含乘法的运算符,如移位和加法,因其与硬件的兼容性而日益受到重视。然而,采用这些运算符的神经网络(NNs)通常表现出比具有相同结构的传统NNs更低的准确性。ShiftAddAug利用成本较高的乘法来增强高效但功能较弱的无乘法运算符,从而在没有任何推理开销的情况下提高性能。将一个ShiftAd
  • 2024-09-23ScanFormer:逐层抵达目标,基于特征金字塔的指代表达理解框架 | CVPR'24
    指代表达理解(REC)旨在在图像中定位由自由形式自然语言描述指定的目标对象。尽管最先进的方法取得了令人印象深刻的性能,但它们对图像进行了密集感知,包含与语言查询无关的多余视觉区域,导致额外的计算开销。这启发论文探讨一个问题:能否消除与语言无关的多余视觉区域,以提高模型的效率?
  • 2024-09-19CVPR(Conference On Computer Vision and Pattern Recognition)近十年研究热点追踪
    CVPR(ConferenceOnComputerVisionandPatternRecognition)近十年研究热点追踪CVPR近十年(2015~2024)研究热点追踪
  • 2024-09-17YOLOv9改进系列,YOLOv9主干网络替换为RepViT (CVPR 2024,清华提出,独家首发),助力涨点
    摘要轻量级视觉变换器(ViTs)在资源受限的移动设备上表现出优越的性能和较低的延迟,相比之下轻量级卷积神经网络(CNNs)稍显逊色。研究人员发现了许多轻量级ViTs和轻量级CNNs之间的结构联系。然而,它们在块结构、宏观和微观设计上的显著架构差异尚未得到充分研究。在本研究中
  • 2024-09-05Stable Diffusion读你大脑信号就能重现图像,研究还被CVPR接收了
    大脑活动到图像,StableDiffusion能重建。如果人工智能可以解读你的想象,将你脑海中的图像变成现实,那会怎样?虽然这听起来有点赛博朋克。但最近发表的一篇论文,让AI圈吵翻了天。这篇论文发现,他们使用最近非常火的StableDiffusion,就能重建大脑活动中的高分辨率、高精
  • 2024-09-04OVMR:华为北大联手,基于多模态融合的SOTA开放词汇识别 | CVPR 2024
    即插即用的方法OVMR将新类别的多模态线索嵌入到VLM中,以增强其在开放词汇识别中的能力。它最初利用多模态分类器生成模块将示例图像嵌入到视觉标记中,然后通过推断它们与语言编码器的上下文关系来自适应地融合多模态线索。为了减轻低质量模态的负面影响,通过一个无参数融合模块根据
  • 2024-08-30AIGC时代,仅用合成数据训练模型到底行不行?来一探究竟 | CVPR 2024
    首个针对使用合成数据训练的模型在不同稳健性指标上进行详细分析的研究,展示了如SynCLIP和SynCLR等合成克隆模型,其性能在可接受的范围内接近于在真实图像上训练的对应模型。这一结论适用于所有稳健性指标,除了常见的图像损坏和OOD(域外分布)检测。另一方面,监督模型SynViT-B在除形状偏
  • 2024-08-19RealNet:从数据生成到模型训练的最新工业异常检测 | CVPR 2024
    论文提出了一种创新的自监督异常检测框架RealNet,集成了三个核心组件:可控制强度的扩散异常合成(SDAS)、异常感知特征选择(AFS)和重构残差选择(RRS)。这些组件通过协同作用,使RealNet能够有效地利用大规模预训练模型来进行异常检测,同时保持计算开销在合理的低范围内。RealNet为未来利用预
  • 2024-08-14DeiT-LT:印度科学院提出针对长尾数据的`DeiT`升级模型 | CVPR 2024
    DeiT-LT为ViT在长尾数据集上的应用,通过蒸馏DIST标记引入CNN知识,以及使用分布外图像并重新加权蒸馏损失来增强对尾类的关注。此外,为了减轻过拟合,论文建议用经过SAM训练的CNN教师进行蒸馏,促使所有ViT块中DIST标记学习低秩泛化特征。经过DeiT-LT的训练方案,DIST标记成为尾类的专家,分
  • 2024-08-13DRM:清华提出无偏差的新类发现与定位新方法 | CVPR 2024
    论文分析了现有的新类别发现和定位(NCDL)方法并确定了核心问题:目标检测器往往偏向已知的目标,忽略未知的目标。为了解决这个问题,论文提出了去偏差区域挖掘(DRM)方法,以互补的方式结合类无关RPN和类感知RPN进行目标定位,利用未标记数据的半监督对比学习来改进表征网络,以及采用简单高效的m
  • 2024-07-22ScaleDet:AWS 基于标签相似性提出可扩展的多数据集目标检测器 | CVPR 2023
    论文提出了一种可扩展的多数据集目标检测器(ScaleDet),可通过增加训练数据集来扩大其跨数据集的泛化能力。与现有的主要依靠手动重新标记或复杂的优化来统一跨数据集标签的多数据集学习器不同,论文引入简单且可扩展的公式来为多数据集训练产生语义统一的标签空间,通过视觉文本对齐进
  • 2024-07-19SURE:增强不确定性估计的组合拳,快加入到你的训练指南吧 | CVPR 2024
    论文重新审视了深度神经网络中的不确定性估计技术,并整合了一套技术以增强其可靠性。论文的研究表明,多种技术(包括模型正则化、分类器改造和优化策略)的综合应用显着提高了图像分类任务中不确定性预测的准确性来源:晓飞的算法工程笔记公众号论文:SURE:SUrveyREcipesforbuild
  • 2024-07-18MViTv2:Facebook出品,进一步优化的多尺度ViT | CVPR 2022
    论文将MultiscaleVisionTransformers(MViTv2)作为图像和视频分类以及对象检测的统一架构进行研究,结合分解的相对位置编码和残差池化连接提出了MViT的改进版本来源:晓飞的算法工程笔记公众号论文:MViTv2:ImprovedMultiscaleVisionTransformersforClassificationand
  • 2024-07-12还在困惑需要多少数据吗?来看看这份估计指南 | CVPR 2022
    论文基于实验验证,为数据需求预测这一问题提供了比较有用的建议,详情可以直接看看Conclusion部分。来源:晓飞的算法工程笔记公众号论文:HowMuchMoreDataDoINeed?EstimatingRequirementsforDownstreamTasks论文地址:https://arxiv.org/abs/2207.01725论文代码:http
  • 2024-05-27CVPR 2024 | 谷歌提出OmniGlue:特征匹配新工作
    前言 第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了!欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自机器之心仅用于学术分享,若侵权请联系删除CV方向的准研究生们,未来三年如何度过?招聘高光谱图像、语
  • 2024-04-30三项国际人工智能顶会大奖!拿下!
     近日,国际人工智能顶会CVPR 2024举办的第6届自然场景情感行为分析挑战赛(6thWorkshopandCompetitiononAffectiveBehaviorAnalysisin-the-wild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感识别任务中表现出色,斩获双赛道亚军、单个赛道季军,并受邀在CVPRABAW研讨会上作
  • 2024-04-22LORS:腾讯提出低秩残差结构,瘦身模型不掉点 | CVPR 2024
    深度学习模型通常堆叠大量结构和功能相同的结构,虽然有效,但会导致参数数量大幅增加,给实际应用带来了挑战。为了缓解这个问题,LORS(低秩残差结构)允许堆叠模块共享大部分参数,每个模块仅需要少量的唯一参数即可匹配甚至超过全量参数的性能。实验结果表明,LORS减少解码器70%的参数后仍
  • 2024-04-09DS-Net:可落地的动态网络,实际加速1.62倍,快改造起来 | CVPR 2021 Oral
    论文提出能够适配硬件加速的动态网络DS-Net,通过提出的double-headed动态门控来实现动态路由。基于论文提出的高性能网络设计和IEB、SGS训练策略,仅用1/2-1/4的计算量就能达到静态SOTA网络性能,实际加速也有1.62倍 来源:晓飞的算法工程笔记公众号论文:DynamicSlimmableNetwo
  • 2024-04-08CondeseNetV2:清华与华为出品,保持特征的新鲜是特征复用的关键 | CVPR 2021
    论文提出SFR模块,直接重新激活一组浅层特征来提升其在后续层的复用效率,而且整个重激活模式可端到端学习。由于重激活的稀疏性,额外引入的计算量非常小。从实验结果来看,基于SFR模块提出的CondeseNetV2性能还是很不错的,值得学习 来源:晓飞的算法工程笔记公众号论文:CondenseNet
  • 2024-03-29Hybrid-PSC:基于对比学习的混合网络,解决长尾图片分类 | CVPR 2021
     论文提出新颖的混合网络用于解决长尾图片分类问题,该网络由用于图像特征学习的对比学习分支和用于分类器学习的交叉熵分支组成,在训练过程逐步将训练权重调整至分类器学习,达到更好的特征得出更好的分类器的思想。另外,为了节省内存消耗,论文提出原型有监督对比学习。从实验结果来看
  • 2024-03-29YOLOF:单层特征检测也可以比FPN更出色 | CVPR 2021
     论文通过分析发现FPN的成功在于divide-and-conquer策略解决了目标检测的优化问题,借此研究设计了仅用单层特征预测的高效检测网络YOLOF。YOLOF在结构上没有很多花哨的结构,却在准确率、推理速度和收敛速度上都有不错的提升,相对于眼花缭乱的FPN魔改结构,十分值得学习来源:晓飞的算
  • 2024-03-22舞蹈AI革新 ,清华大学推出Lodge,长序列舞蹈生成的新高度,CVPR
    引言:探索音乐驱动的长时舞蹈生成在数字娱乐和虚拟现实的时代,音乐驱动的舞蹈生成技术正变得日益重要。从电影制作到游戏开发,再到为舞蹈设计师提供灵感和提高生产力,高质量且多样化的3D舞蹈动作自动生成解决方案的需求不断增长。尽管近年来生成性AI技术取得了飞速发展,现有的方