• 2024-05-27CVPR 2024 | 谷歌提出OmniGlue:特征匹配新工作
    前言 第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了!欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自机器之心仅用于学术分享,若侵权请联系删除CV方向的准研究生们,未来三年如何度过?招聘高光谱图像、语
  • 2024-04-30三项国际人工智能顶会大奖!拿下!
     近日,国际人工智能顶会CVPR 2024举办的第6届自然场景情感行为分析挑战赛(6thWorkshopandCompetitiononAffectiveBehaviorAnalysisin-the-wild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感识别任务中表现出色,斩获双赛道亚军、单个赛道季军,并受邀在CVPRABAW研讨会上作
  • 2024-04-22LORS:腾讯提出低秩残差结构,瘦身模型不掉点 | CVPR 2024
    深度学习模型通常堆叠大量结构和功能相同的结构,虽然有效,但会导致参数数量大幅增加,给实际应用带来了挑战。为了缓解这个问题,LORS(低秩残差结构)允许堆叠模块共享大部分参数,每个模块仅需要少量的唯一参数即可匹配甚至超过全量参数的性能。实验结果表明,LORS减少解码器70%的参数后仍
  • 2024-04-09DS-Net:可落地的动态网络,实际加速1.62倍,快改造起来 | CVPR 2021 Oral
    论文提出能够适配硬件加速的动态网络DS-Net,通过提出的double-headed动态门控来实现动态路由。基于论文提出的高性能网络设计和IEB、SGS训练策略,仅用1/2-1/4的计算量就能达到静态SOTA网络性能,实际加速也有1.62倍 来源:晓飞的算法工程笔记公众号论文:DynamicSlimmableNetwo
  • 2024-04-08CondeseNetV2:清华与华为出品,保持特征的新鲜是特征复用的关键 | CVPR 2021
    论文提出SFR模块,直接重新激活一组浅层特征来提升其在后续层的复用效率,而且整个重激活模式可端到端学习。由于重激活的稀疏性,额外引入的计算量非常小。从实验结果来看,基于SFR模块提出的CondeseNetV2性能还是很不错的,值得学习 来源:晓飞的算法工程笔记公众号论文:CondenseNet
  • 2024-03-29Hybrid-PSC:基于对比学习的混合网络,解决长尾图片分类 | CVPR 2021
     论文提出新颖的混合网络用于解决长尾图片分类问题,该网络由用于图像特征学习的对比学习分支和用于分类器学习的交叉熵分支组成,在训练过程逐步将训练权重调整至分类器学习,达到更好的特征得出更好的分类器的思想。另外,为了节省内存消耗,论文提出原型有监督对比学习。从实验结果来看
  • 2024-03-29YOLOF:单层特征检测也可以比FPN更出色 | CVPR 2021
     论文通过分析发现FPN的成功在于divide-and-conquer策略解决了目标检测的优化问题,借此研究设计了仅用单层特征预测的高效检测网络YOLOF。YOLOF在结构上没有很多花哨的结构,却在准确率、推理速度和收敛速度上都有不错的提升,相对于眼花缭乱的FPN魔改结构,十分值得学习来源:晓飞的算
  • 2024-03-22舞蹈AI革新 ,清华大学推出Lodge,长序列舞蹈生成的新高度,CVPR
    引言:探索音乐驱动的长时舞蹈生成在数字娱乐和虚拟现实的时代,音乐驱动的舞蹈生成技术正变得日益重要。从电影制作到游戏开发,再到为舞蹈设计师提供灵感和提高生产力,高质量且多样化的3D舞蹈动作自动生成解决方案的需求不断增长。尽管近年来生成性AI技术取得了飞速发展,现有的方
  • 2024-03-02CVPR 2024 满分论文!Meta提出EfficientSAM:快速分割一切!
    前言 Meta研究者提出了一种改进思路,利用SAM的掩码图像预训练(SAMI)。这是通过利用MAE预训练方法和SAM模型实现的,以获得高质量的预训练ViT编码器。这一方法降低了SAM的复杂性,同时能够保持良好的性能。本文转载自机器之心仅用于学术分享,若侵权请联系删除欢迎关注公
  • 2023-12-182021-CVPR-Transformer Tracking
    TransformerTracking相关性在跟踪领域起着关键作用,特别是在最近流行的暹罗跟踪器中。相关操作是考虑模板与搜索区域之间相似性的一种简单的融合方式。然而,相关操作本身是一个局部线性匹配过程,导致语义信息的丢失并容易陷入局部最优,这可能是设计高精度跟踪算法的瓶颈。还有比相关
  • 2023-08-03论文解读|2020 CVPR:PointASNL:基于自适应采样的非局部神经网络点云鲁棒处理
    原创|文BFT机器人01摘要使用自然图像数据集(如ImageNet)中的大型预训练模型进行迁移学习已经成为医学成像深度学习应用的实际方法。然而,由于自然图像分类和医学成像任务之间的差异,对迁移学习的影响了解甚少。本文对医学影像迁移学习进行了探讨,并对两个大型医学成像任务进行了性能
  • 2023-07-10CVPR 2023 | 南洋理工、商汤提出E3DGE:2D图片秒出3D形象
    前言 在CVPR2023上,南洋理工大学-商汤科技联合实验室S-Lab的研究者提出的基于Encoder的快速3DGANInversion方法,针对现有3DGANinversion方法无法兼顾重建速度、重建质量和编辑质量的问题,提出一种自监督3DGANinversion训练框架。同时,通过构建全局-局部的多尺度结构以及2D-3D
  • 2023-06-23CVPR最佳论文颁给自动驾驶大模型!中国团队第一单位,近10年三大视觉顶会首例
    前言 这个高光时刻,属于自动驾驶,属于大模型,更是属于中国团队。本文转载自量子位仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全
  • 2023-06-23历史最全图像/视频去模糊化精选论文整理分享
        本资源整理了图像/视频图模糊化相关的经典论文、相关的数据集。涉及基于深度学习技术的单图像盲运动去模糊化,非深度学习单图像盲运动去模糊化,非盲去模糊化,多图像/视频运动去模糊化等方面,分享给需要的朋友。     资源整理自网络,源地址:https://github.com/subeeshvasu/
  • 2023-06-16冠军!天翼云在国际AI顶会大模型挑战赛中拔得头筹!
    6月7日,国际人工智能顶会CVPR2023举办的第一届大模型挑战赛(CVPR2023WorkshoponFoundationModel:1stfoundationmodelchallenge)落下帷幕,本次比赛吸引了来自全球著名高校和知名企业的1024名参赛者。经过为期2个月的激烈角逐,天翼云AI团队(队名CTRL)在多任务大模型赛道中表现出色,
  • 2023-06-1512篇CVPR 2023 最佳论文候选
    前言 CVPR2023开幕在即,官方公布了12篇最佳论文候选,快来看看都是什么内容吧!本文转载自我爱计算机视觉仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各大方向专栏与各个部署框架最全教程
  • 2023-05-22CVPR 2023 | Collaborative Diffusion 怎样让不同的扩散模型合作?
    前言 CVPR2023有哪些亮点?CollaborativeDiffusion提供了一种简单有效的方法来实现不同扩散模型之间的合作。本文转载自我爱计算机视觉作者|HuangZiqi仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV
  • 2023-05-11车辆路径问题——CVPR的Python实现
    车辆路径问题通常被定义为装运一系列点或接收点,通过他们组织车辆适当途径有序。在一定的约束条件,如对商品的需求,交货数量,交付的交付时间,车辆容量限制,行驶里程限制,时间限制,以实现某些目标。如果最短距离,最低的成本,尽可能少的时间,尽量少使用车辆。在物流和运输,因为运输点,更多的客户,
  • 2023-05-04商汤视觉跟踪算法两部曲之SiamMask , CVPR 2019商汤提出了对视觉目标(VOT)和对视频目标(VOS)的统一框?
    商汤视觉跟踪算法两部曲之SiamMask,CVPR2019商汤提出了对视觉目标(VOT)和对视频目标(VOS)的统一框架。将跟踪的初始化只需要提供视频跟踪的box输入即可,输出时却能同时得到box和mask两个输出。只需要在Siamese网络中额外增加一个Mask分支即可。本工程提供复现该论文的C++工程代码及
  • 2023-04-26CVPR'23|向CLIP学习预训练跨模态!简单高效的零样本参考图像分割方法
    前言 本文提出了一种zero-shot的Referringimagesegmentation方法,该方法利用了来自CLIP的pre-train的跨模态知识。所提方法的性能明显优于所有基线方法和监督较弱的方法。本文转载自极市平台作者|CV开发者都爱看的仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南
  • 2023-04-25sun-2023-DeFeeNet-CVPR
    #DeFeeNet:Consecutive3DHumanMotionPredictionwithDeviationFeedback#paper1.paper-info1.1MetadataAuthor::[[XiaoningSun]],[[HuaijiangSun]],[[BinLi]],[[DongWei]],[[WeiqingLi]],[[JianfengLu]]作者机构::njust.edu.cnKeywords::#HMPJou
  • 2023-04-21猛读论文13 |【CVPR 2022 UDA】Unleashing Potential of Unsupervised Pre-Training with Intra-Identity Regular
    动机解决(1)对比学习管道中的增强通常会扭曲人物图像中的判别线索(2)细粒度的局部特征人物图像尚未得到充分探索。 思路    方法 
  • 2023-04-15CVPR 2023 深挖无标签数据价值!SOLIDER:用于以人为中心的视觉
    前言 在现今的各种视觉智能场景中,对图像中人的理解和分析一直都是一个非常重要的环节。SOLIDER是CVPR2023录用的一篇来自于阿里达摩院的工作,是一个专门用于支持各种人体任务的视觉预训练模型。它提供一种自监督训练方式,让我们可以充分利用市面上大量的人体无标注数据训练出一
  • 2023-04-14CVPR 2023|21 篇数据集工作汇总(附打包下载链接)
    前言 本文汇总了21篇CVPR2023中有关数据集的工作,附下载链接。本文转载自极市平台仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各大方向专栏与各个部署框架最全教程整理计算机视觉入门1v
  • 2023-04-12CVPR 2023|两行代码高效缓解视觉Transformer过拟合,美图&国科大联合提出正则化方法DropKey
    前言 美图影像研究院(MTLab)与中国科学院大学突破性地提出正则化方法DropKey,用于缓解VisionTransformer中的过拟合问题。该方法通过在注意力计算阶段随机drop部分Key以鼓励网络捕获目标对象的全局信息,从而避免了由过于聚焦局部信息所引发的模型偏置问题,继而提升了基于Tra