吴恩达机器学习笔记|（12）应用实例-照片OCR

时间：2022-08-19 17:59:27浏览次数：80

标签：照片吴恩达 12 识别分类器模块移除 OCR

介绍一个复杂的机器学习系统如何组成

一、照片光学字符识别（Photo Optical Character Recognition，photo OCR）

如查找图片时，输入照片上存在的词语就可以将该照片搜索出来。

OCR步骤：文本检测、字符分割、字符分类（识别）

其中第3步可以利用之前学习的神经网络进行识别（exercise4中有对图像中的0-9数字进行识别）。

滑动窗口分类器(sliding windows classifier)

用一个固定大小的框（窗口）以一定的步长遍历图像的所有区域并进行分类。

perdestrian detection

将滑动窗口应用到文本检测

将分类器认为可能有文本的地方用白色表示，没有的用黑色表示。然后逐渐扩大白色区域的范围（经过放大算子）

text detection

将1维滑动窗口应用到字符分割

将不同的图片文本样本分类为正样本（有间隔）和负样本（完整字母，无间隔）进行训练，可能用到网络或者其它算法，最后得到一个分类器。然后将分类器应用于上一步得到的文本框，会有如下效果：

character segmentation

二、获取数据集和人工数据合成(artificial data synthesis)

可以通过在一份原始数据中引入合理的失真合成多份不同场景下的数据。如给图像或音频加入噪声。

决定是否要获取更多数据

画学习曲线——高方差情况下增大数据集规模有利于提高模型性能
计算增大10倍数据集所需工作量，以及找到降低增大数据集所需工作量的方法

三、上限分析

在决定下一步做什么时，对工作流进行上限分析可以指导哪一部分最值得研究，即决定如何对每一部分分配资源。

例：人脸识别机器学习系统开发

将问题划分为多个子模块，分别对每个模块进行上限分析，然后测试观察哪一个模块的提升给系统整体性能提升能带来更大的价值。如在预处理阶段（背景移除），人工把所有目标标记出来并移除背景，再运行后续的模块，可以看到准确率提升了0.1%；而人工将脸部特征识别标记出来，即标记出鼻子、眼睛、嘴巴等，再运行后续模块，准确率提升了5.9%；其它模块类似。由此可见，将大部分资源放在背景移除模块远不如将资源集中在面部特征识别或逻辑回归算法调整部分。这就是上限分析的作用，将有限的精力和资源放在更有利于提升系统整体性能的子模块。

标签：照片,吴恩达,12,识别,分类器,模块,移除,OCR
From： https://www.cnblogs.com/hjd21/p/16602835.html

Educational Codeforces Round 117 (Rated for Div. 2) CF1612
https://codeforces.com/contest/1612VP过了A~E，感觉海星。F,G这几天补。主要是luogu有翻译拯救了英语不好的我。A一眼\(x+y\equiv0\pmod{2}\)，否则无解。那么显......
吴恩达机器学习笔记|（11）学习大数据集
应用于大数据集较为合适的两种算法：随机梯度下降和mini-batch梯度下降。一、随机梯度下降（stochasticgradientdescent）由于之前实现梯度下降时，每次迭代都需要考虑所......
吴恩达机器学习笔记|（8）无监督学习
一、无监督学习定义：训练数据不带有任何标签。算法的目的是找到数据本身具有的结构特征。经典的算法：聚类（cluster）、降维（dimensionalityreduction）二、K-means聚类2.1......
吴恩达机器学习笔记|（9）异常检测（Anomaly-Detection）
例：飞机引擎检测、欺诈检测（用户的网站行为检测）一、高斯分布\(X\simN(\mu,\sigma^2)\)\(p(x;\mu,\sigma^2)=\frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{(x-\mu)^2}{2\si......
吴恩达机器学习笔记|（10）推荐系统（Recommendeder-System）
1.基于内容的推荐系统（Content-basedrecommendersystems）如将每部电影的内容划分为爱情元素（romance）\(x_1\)+动作元素（action）\(x_2\)，并且有一定的数值描述该电影成分。......
吴恩达机器学习笔记|（4）过拟合问题及正则化（Overfitting&regularization）
一、欠/过拟合问题（Underfitting/OverfittingProblem）欠拟合拟合偏差非常大，用于预测时误差也会非常大。过拟合方差非常大，即拟合曲线与训练数据拟合得非常好以至于......
吴恩达机器学习笔记|（3）逻辑回归（Logistic-Regression）
一、分类问题介绍\(y\in\{0,1\}\)0:NegativeClass1:PositiveClass例子：邮件分类；肿瘤分类；LogisticRegression的特点其预测值介于0-1间，而不会大于1或小于0事......
吴恩达机器学习笔记|（2）线性回归（Linear-Regression）
一、模型描述建立y关于x的线性函数HypothesisFunction:\(H_\theta(x)=\theta_0+\theta_1x\)用\(H_\theta(x)\)来拟合y与x的关系Parameters:\(\theta_0,\thet......
1016 [USACO 2012 Dec S]Milk Routing 最短路忽略部分路径三个参量
链接：https://ac.nowcoder.com/acm/contest/26077/1016来源：牛客网题目描述FarmerJohn'sfarmhasanoutdatednetworkofMpipes(1<=......
KeyCode对照表空格回车 F1234567890 等键代码
keycode8=BackSpace回格keycode9=Tabkeycode12=Clearkeycode13=Enter回车keycode16=Shift_Lkeycode17=Control_Lkeycode18=......

吴恩达机器学习笔记|（12）应用实例-照片OCR

一、照片光学字符识别（Photo Optical Character Recognition，photo OCR）

二、获取数据集和人工数据合成(artificial data synthesis)

三、上限分析

相关文章

赞助商

阅读排行