基于开源模型搭建实时人脸识别系统（五）：人脸跟踪

时间：2023-11-01 22:45:18浏览次数：42

继续填坑，之前已经讲了人脸检测，人脸检测是定位出画面中人脸的位置，理论上把检测到的人脸进行提特征就能做人脸识别了，不过直接这样做是有缺陷，一是存在很大的资源浪费，毕竟同一个人出现在画面，我们实际上应该只需要做一次识别就知道他的身份（理想情况下），而不需要每一帧都去做；二是如果对每一帧都进行独立的检测->识别，就会出现频繁的事件，不利于业务的开发。当然，还有一些其他需要使得我们需要一种方式在不做识别的情况下，就知道当前帧的目标和前面帧的目标是同一个目标，比如我们要对一个门口进行进出的计数，这个领域就是目标跟踪。
多目标跟踪是对于给定的视频序列，找到每一帧图像中的运动目标，在连续视频帧中对同一个目标分配相同的身份标识号（ID），从而形成不同物体各自的运动轨迹。这些物体可以是任意的，如行人、车辆、运动员、动物以及足球等无生命物体，人脸跟踪属于目标跟踪。

基于机器学习的目标跟踪

与其他领域类似，在深度学习爆发前，也有很多基于机器学习的目标跟踪方法，一般是依据目标的颜色分布信息，如Meanshift，或相邻帧的像素匹配，如光流法。感兴趣可以自行搜索。

基于目标检测的跟踪（tracking by detection）

这类方法对每一帧的检测结果与历史跟踪结果进行匹配（对于第一次出现的目标分配新的ID），最简单的一种方式是用目标检测框与历史跟踪框的IOU来评价目标的匹配度，使用贪心算法进行两两匹配，将IOU超过阈值的且最匹配的检测框作为最新的跟踪框，若有检测框未匹配上，则新建ID, 若有跟踪框未匹配上，则删除ID。匹配方法还有匈牙利匹配等。
除了直接使用检测框更新跟踪框外，还有与卡尔曼滤波相结合更新跟踪框的方式，代表性的方式是SORT(Simple Object Realtime Tracking)。

基于目标回归的跟踪

基于目标检测的跟踪比较依赖目标检测框的精度和速度，且实际上没有利用上历史信息来帮助检测。基于目标回归的方法则利用历史跟踪框，回归该目标在当前帧预测目标的位置。比如人脸中，有些方法利用MTCNN的Onet去回归人脸位置，这种方法一般要比每帧检测要快（单目标下）。

基于深度特征的目标跟踪

在发生目标遮挡时，完全基于框匹配或传统机器学习的方法容易出现目标丢失，从而目标ID发生变化。基于深度特征的目标跟踪通过提取目标的特征然后匹配的方式将目标重新关联上，代表方法是DeepSort, 这种方式需要提取目标特征，计算量较高。

基于端到端的目标跟踪

上面的方法基本都是分步骤的实现目标跟踪：目标检测/回归->框匹配，还有一种方式是端到端的方式，不分多个步骤，对硬件要求高，笔者也没有了解过。

本系统的选择

考虑到CPU实时需要，选择基于目标检测的跟踪, 具体而言选择sort方法。

项目源码

https://mbd.pub/o/bread/mbd-ZJyTmZty

标签：基于,人脸识别,匹配,检测,目标,开源,人脸,跟踪
From： https://www.cnblogs.com/haoliuhust/p/17804320.html

HyperAI超神经 x 中国信通院 | 可信开源大模型案例汇编（第一期）案例征集计划正式启动
为进一步促进大模型的开源和合作，引导开源大模型产业健康规范发展，中国信息通信研究院现开启「可信开源大模型案例汇编（第一期）」的案例征集计划。HyperAI超神经将以合作伙伴的身份，协助调研国产开源大模型的技术细节、应用场景、行业现状、发展趋势及未来展望，同时关注开源大模型技术......
开源GTKSystem.Windows.Forms，在这里更新预告
开源GTKSystem.Windows.Forms，在这里更新预告gitee码云开源地址：https://gitee.com/easywebfactory/gtksystem-windows-formsgithub网络有墙，暂时就不上github了。目前利用空余时间持续开发更新，欢迎留言交流。更新预告：增加Timer类修改按钮的背景图属性生成方式实现控件的Pain......
《完蛋！我被美女包围了》突然火了！世界首个开源贡献榜出炉丨 RTE 开发者日报 Vol.75
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE （RealTimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎......
开源物流管理系统——【2】货运管理
将近一周的时间过去了，又到了周三，能写第二篇博客，心里还是挺兴奋的。更新的太频繁，时间上不允许，毕竟手边也有工作要做；再者也不利于细节体验的打磨。尽管依然有不少未考虑到的地方，但不妨先来看下效果：本次更新的内容主要是创建并完善货运管理模块，细节如下：1.自动运单编号生成与校验2.......
Fluent UI System Icons 开源的图标集合
软件介绍FluentUISystemIcons是由Microsoft开发的一个开源软件，它提供了一套丰富多样的系统图标，用于在应用程序和网站中使用。这些图标遵循FluentDesignSystem的设计原则，可用于增强用户界面的可视效果和交互性。功能特点1.丰富的系统图标库:FluentUISystemIcons提供......
《安富莱嵌入式周报》第320期：键盘敲击声解码, 军工级boot设计，开源CNC运动控制器，C语言
视频版：https://www.bilibili.com/video/BV1Cr4y1d7Mp/1、键盘敲击声解码https://arxiv.org/abs/2308.01074键盘敲击声被解码的话，我们使用键盘输入密码将被方便的解码出来。这篇文章介绍了一种使用最先进的深度学习模型，以便使用手机麦克风对笔记本电脑敲击键盘分析。实际测试训练......
开源软件：释放创新的力量，改变数字世界的游戏规则
在充满活力的技术领域，创新是至高无上的，有一种方法已获得显著的吸引力——开源软件。开源软件凭借其透明、协作和无限可能性的精神，彻底改变了我们开发、共享和定制应用程序的方式。从操作系统到数据分析工具，其影响跨越了多个领域。本文将带您深入了解开源软件的历史、优势和充满活......
开源 2 年、打磨 13 年、300 万行代码的开源项目
从刻在石壁上的甲骨文，再到写在纸上的汉字，每一次信息载体的变更都是文化进步的重要标志。在如今这个信息数字化的时代，我们在享受着数字化便利的同时，数据也在我们看不见的地方飞速增长着，数据的重要性不言而喻。那应该如何将海量数据完整、有序、持久化地保存下来呢？程序员小伙伴看......
心理测评测试H5小程序开源版开发
心理测评测试h5公众号字节微信小程序app开源版开发探索心理奥秘，解读内心世界！现在，我们为你带来一款独具特色的心理测评小程序——心理测评测试H5公众号字节微信小程序APP开源版开发！这个强大而灵活的工具，将帮助你更好地了解自己和他人，开启心灵探索之旅。一、跨平台神器：Uni-APP助力多......
做物联网的有福了，一个开源的、企业级的物联网平台，它集成了设备管理、数据安全通信、消
去关注、不迷路一、项目概述JetLinksIOT是一个开源的、企业级的物联网平台，它集成了设备管理、数据安全通信、消息订阅、规则引擎等一系列物联网核心能力，支持以平台适配设备的方式连接海量设备，采集设备数据上云，提供云端API，通过调用云端API实现远程控制。JetLinks物联网平台......