大家好,我是你们的老朋友——泽哥!最近一直没有写博客是因为泽哥最近在忙本科毕业设计。泽哥的本科毕业设计是研究DPM模型的,相信大家也略微了解,DPM模型即Deformable Part Model(可变形子部件模板模型)。没有研究DPM模型的小伙伴请移步这里:
DPM译文(由masiikkk大神翻译)
如何在windows下运行DPM(release4.01)
Deformable Part Model 相关网页:http://www.cs.berkeley.edu/~rbg/latent/index.html
Pedro Felzenszwalb的个人主页:http://cs.brown.edu/~pff/
做过视觉跟踪技术以及图像识别技术的同学或多或少的对DPM算法由一些了解4的。在RCNN、Mask-RCNN诞生之前,DPM在图像识别领域一直处于王者的地位,在面对发生形变的非刚性目标时,DPM部件滤波器的设计可以完美的解决形变问题。可以说,DPM开创了利用卷积提取图像特征的先河,为以后的卷积神经网络等深度学习算法打下了坚实的基础。
DPM(release 4.01)是RGB大神在2012年开源的,对非刚性目标的检测召回率非常高,但是美中不足的是DPM4的计算量特别大。DPM4的计算过程主要集中在利用滑动窗口法对图像的特征金字塔进行卷积计算上。我们知道,一个512*512的三通道八位图像的特征金字塔一共有43层,每一层的第三维都是32层。如果加载一个三组件的DPM模型,那么我们将会得到54个滤波器(6个根滤波器加上48个部件滤波器),这54个滤波器每一个都要与43层特征金字塔上的每一个cell进行卷积,可见这种计算量有多么可怕!
可见DPM4是无法应用于实时检测的,对此RGB在2014年开源了一份由PCA降维以及casscade加速的DPM。本人下载下来进行运行测试,发现这个版本的DPM简直无敌,在不损失召回率(图像检测准确率)的前提下,速度竟然能快出13倍。下面本人将已经调试好的,可以在windows下直接运行的源代码开源出来,供同学们学习。
上张图片是程序所在文件夹
上图为经典的无cascade加速的DPM(release4.01)的程序启动入口。