目录
计算机视觉是什么
计算机视觉是一门让计算机学会 "看"的学科,研究如何自动理解图像和视频中的内容
图中的动物是什么?(分类)
哪个位置有狗?(检测)
狗在做什么?(行为识别)
计算机视觉应用
人脸识别、车辆自动驾驶、虚拟主播、动漫特效等
传统视觉特征
LBP(Local Binary Parttern)
LBP是定义在像素3x3邻域内的,以邻域中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3x3邻域内的8个点经比较可产生8位二进制数(通常转换为十进制数即LBP码,共256种),即得到该邻域中心像素点的LBP值,并用这个值来反映该区域的纹理信息。
Shift(Scale Invariant Feature Transform)
HOG(Histogram of Oriented Gradients)
机器学习基础
机器学习是什么
从数据中学习经验,以解决特定问题。
例如人脸检测
为什么要让"机器"去"学习"
例如人脸识别
图像数据量大且变化大,难以用人工设计特征来保证足够的鲁棒性
机器学习是什么
让计算机从数据中学习去解决问题
机器学习的典型范式
机器学习擅长的地方是那些难以通过简单算法解决的问题(简单=人理解范围,可以手工设计出来的算法)
监督学习
数据之间存在某种映射关系,如何基于有限的数据样本推断出这种关系?
人脸图像 -->身份
无监督学习
数据自身是否存在某种“结构”或“规律”?
强化学习
如何和环境交互,以获得最大收益?
机器学习的基本流程
以分类问题为例,采用机器学习的方法解决实际问题通常需要3个步骤:
1.训练
我们需要采集一些数据,标注它们的类别,从中选取一部分用于训练分类器,得到一个可以用于分类器。
2.验证
从采集、标注的数据中另外选取一部分,测试所得分类器的分类精度
验证所用的数据不能和训练重合,以保证分类器的泛化性能:在一部分数据上训练的分类器可以在其余的数据表现出足够分类精度
3.应用
将经过验证的分类器集成到实际的业务系统中,实现对应的功能
在应用阶段,分类器面对的数据都是在训练、验证阶段没有见过的。