计算机视觉是人工智能的关键领域之一,是一门研究如何使机器“看”的科学。图像目标检测又是计算机视觉的关键任务,主要对图像或视频中的物体进行识别和定位,是AI后续应用的基础。
因此,检测性能的好坏直接影响到后续目标 追踪、动作识别的性能。传统图像目标检测的滑窗法虽然简单易于理解,但随目标大小而变化的窗口对图像进行从左 至右、从上至下的全局搜索导致效率低下。
1为了在滑动窗口检测器的基础上提高搜索速度,选择性搜索方法(selective search method)孕育而出,基于这一想法采用子区域合并的方式进行候选区域的提取 从而确定目标。 有助于确定目标之间的关系,以及目标在图像中的上下文。应用包括人脸识别、车牌识别和卫星图像分析。例如,零售和时尚等行业在基于图像的搜索中使用了图像分割。自动驾驶汽车用它来了解周围的环境
目标检测和人脸检测
这些应用包括识别数字图像中特定类的目标实例。语义对象可以分类成类,如人脸、汽车、建筑物或猫。
人脸检测 - 一种用于许多应用的目标检测,包括数字相机的生物识别和自动对焦功能。算法检测和验证面部特征的存在。例如,眼睛在灰度图像中显示为谷地。
医学影像 - 从医学影像中提取临床相关信息。例如,放射学家可以使用机器学习来增强分析,通过将图像分割成不同的器官、组织类型或疾病症状。这可以减少运行诊断测试所需的时间。
随着技术的普及,各家企业的框架逐渐成熟化,图像分割技术的门槛会越来越低。但是由于实际业务的不断丰富和深入,开源框架和工具也已经无法直接满足实际生产和业务需求。