AI科研灵感致力于成为您在人工智能领域的领航者,定期更新人工智能领域的重大新闻与最新动态,和您一起探索AI的无限可能。立即关注我们,开启您的AI学习之旅!
2025深度学习发论文&模型涨点之——卡尔曼滤波+SAM
卡尔曼滤波(Kalman Filter)与SAM(Segment Anything Model)结合,构成了一种高效且鲁棒的视觉目标跟踪框架,这一创新方法在NeurIPS 2024和CVPR 2024等顶会上频频亮相,并在医学影像、自动驾驶等实际应用中展现出了广泛的适用性。
-
卡尔曼滤波:是一种高效率的递归滤波器,能够从一系列不完全及包含噪声的测量中估计动态系统的状态。它通过预测和更新两个步骤,不断优化状态估计。
-
SAM:是一种强大的图像分割模型,能够对任意目标进行分割。其特点是无需大量标注数据即可实现高质量的分割。
小编整理了一些卡尔曼滤波+SAM【论文】合集,以下放出部分,全部论文PDF版皆可领取。
需要的同学
回复“卡尔曼滤波+SAM”即可全部领取
论文精选
论文1:
Auxiliary MCMC and particle Gibbs samplers for parallelisable inference in latent dynamical systems
辅助MCMC和粒子吉布斯采样器用于潜在动态系统的可并行推断
方法
-
辅助卡尔曼采样器:通过引入辅助观测变量,将目标分布π与辅助变量u联合起来,形成π(x0:T, u0:T),然后通过Hastings-within-Gibbs步骤进行采样。
-
辅助粒子吉布斯采样器:将粒子滤波(PF)和粒子平滑(PS)算法与辅助观测变量结合,通过条件序贯蒙特卡洛(cSMC)算法进行采样,利用辅助变量设计更优的提议分布。
-
并行化策略:利用前缀和算法和分治策略,将采样过程并行化,使得算法在GPU等并行硬件上的时间复杂度降低到O(log T)。
创新点
-
辅助卡尔曼采样器:通过引入辅助变量,将时间复杂度从O(T^2)降低到O(T),并扩展到非高斯先验动态模型,提高了采样效率。
-
辅助粒子吉布斯采样器:通过辅助变量,将粒子滤波的退化问题转化为局部MCMC移动,提高了算法对高维数据的鲁棒性,并减少了因观测信息过于丰富而导致的退化问题。
-
并行化性能提升:在多维随机波动模型、高维时空模型和连续-离散扩散平滑问题的参数估计中,与现有方法相比,展示了改进的统计和计算性能,特别是在GPU上实现了显著的加速。
论文2:
Delving into the Trajectory Long-tail Distribution for Muti-object Tracking
深入研究多目标跟踪中的轨迹长尾分布
方法
-
数据增强策略:提出了针对静态相机视图(SVA)和动态相机视图(DVA)的数据增强策略,通过回溯和预测尾类行人的轨迹,以及使用扩散模型改变场景背景。
-
组softmax(GS)模块:设计了GS模块,将行人分为不相关的组,并对每组单独进行softmax操作,以改善尾类行人的外观特征提取能力。
创新点
-
数据增强策略:SVA和DVA策略有效地减少了长尾分布对多目标跟踪性能的影响,通过回溯和预测尾类行人的轨迹,提高了网络对尾类行人的学习能力。
-
组softmax(GS)模块:GS模块通过分组softmax操作,防止了头类权重对尾类的显著抑制,提高了网络提取尾类外观特征的能力,从而在所有类别、头类和尾类上均取得了最佳性能。
-
性能提升:在MOTChallenge基准测试中,与基线方法相比,使用该方法训练的网络在MOTA、IDF1等关键指标上取得了显著提升,例如在MOT20测试集上,FairMOT使用该策略训练时,MOTA提升了4.1%,IDF1提升了3.0%。
论文3:
Efficient Derivative-free Bayesian Inference for Large-Scale Inverse Problems
大规模反问题的有效无导数贝叶斯推断
方法
-
基于卡尔曼方法的框架:提出了一种基于卡尔曼方法的框架,通过近似一个新颖的平均场动力系统的滤波分布来高效地进行贝叶斯推断。
-
集合方法:应用集合方法获得平均场模型滤波分布的相互作用粒子系统近似,并提出了包括低秩近似和双保真方法在内的实用策略,以进一步降低计算和内存成本。
-
线性分析:在线性反问题的设置中,建立了理论属性,证明了所需的贝叶斯后验分布由平均场动力系统的滤波分布的稳态给出,并证明了指数收敛到它。
创新点
-
指数收敛:在线性高斯反问题中,证明了滤波分布的均值和精度矩阵指数快速收敛到后验均值和精度矩阵。
-
非线性问题的近似:对于接近高斯的非线性问题,通过顺序计算滤波分布的稳态,为近似贝叶斯后验提供了一种有效的迭代方法。
-
计算效率提升:与现有的卡尔曼基础方法相比,所提出的方法在迭代次数和模型评估次数上显著减少,从O(10^4)降低到O(10),并且每步使用O(10)的并行模型评估,大大降低了计算成本。
-
大规模应用:在两个大规模应用中展示了框架的有效性,包括学习地下水流的渗透参数和全球气候模型中的亚网格尺度参数,证明了该方法在解决大规模反问题中的潜力。
论文4:
SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory
SAMURAI:适应零样本视觉跟踪的Segment Anything Model,具有运动感知记忆
方法
-
运动建模:在SAM 2的基础上,引入了基于卡尔曼滤波的运动建模,通过预测边界框位置和尺寸来帮助选择最自信的掩码。
-
运动感知记忆选择:提出了一个基于混合评分系统的优化记忆选择机制,结合掩码亲和力、对象出现和运动分数,选择更相关的帧存储在记忆库中。
-
实时跟踪:SAMURAI能够在实时操作中提供可靠的视觉对象跟踪,无需重新训练或微调,并且在多个VOT基准测试中展示了强大的泛化能力。
创新点
-
运动建模:通过运动建模,SAMURAI能够更准确地预测对象位置,特别是在快速移动和遮挡的情况下,提高了跟踪的准确性。
-
运动感知记忆选择:与原始的固定窗口记忆方法相比,通过选择性地存储相关帧,减少了拥挤场景中的错误,提高了跟踪的可靠性。
-
性能提升:在LaSOT、LaSOText、GOT-10k等VOT基准测试中,SAMURAI在成功率和精度上取得了显著提升,例如在LaSOText上AUC提升了7.1%,在GOT-10k上AO提升了3.5%。
-
实时性能:SAMURAI能够在实时环境中运行,无需额外的训练或微调,展示了其在动态环境中的实际应用潜力。
小编整理了卡尔曼滤波+SAM论文代码合集
需要的同学
回复“卡尔曼滤波+SAM”即可全部领取
标签:辅助,SAM,200%,卡尔曼滤波,滤波,SAMURAI,方法 From: https://blog.csdn.net/Aimoxin111/article/details/145114204