CTC算法学习笔记

时间：2022-12-26 18:35:34浏览次数：55

标签：输出片段 5Cepsilon% 笔记占位算法输入 CTC math

CTC算法

在OCR或语音识别任务中，经常出现不知道从哪里开始对齐

比如对apple，OCR出aaappppllle这种东西

如果只是简单的去重的话就变成了aple

Connectionist Temporal Classification 算法就是为了解决这种情况的

引入占位符

CTC算法学习笔记_上传

如这个hello，先把占位符之间去重，然后把占位符去掉

要满足重复的元素之间必须要有占位符，如下就是不合法情况(假设长度固定)

CTC算法学习笔记_NLP_02

所以算法对齐有一下属性(对于一个已经标定好的音频片段，训练该片段我们希望输出的是标定的文本)

输入与输出的对齐方式是单调的，即如果输入下一输入片段时输出会保持不变或者也会移动到下一个时间片段
输入与输出是多对一的关系
输出的长度小于等于输入

模型

CTC算法学习笔记_深度学习_03

上面是RNN或其他模型输出的向量，向量中是每个位置对应的每个符号的概率
所以对于一对数据(X,Y)来说，我们希望将下面的概率最大化

$CTC算法学习笔记_深度学习_04$

我们可以发现，对于上面那张图的合法情况非常的多，[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5dSKg9TH-1600284397691)(https://math.jianshu.com/math?formula=he%5Cepsilon%20l%5Cepsilon%20lo%5Cepsilon)]与[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Cj0a088c-1600284397692)(https://math.jianshu.com/math?formula=hee%5Cepsilon%20l%5Cepsilon%20lo)]对应的都是“hello”，不过这个可以用动态规划的方法来解决

用dfs或bfs的方法前后搜一遍，然后在中间的点概率乘起来，DP式很好求

最后的优化目标是最小化负对数似然

标签：输出,片段,5Cepsilon%,笔记,占位,算法,输入,CTC,math
From： https://blog.51cto.com/u_15923198/5970010

带修改的莫队算法学习小记
简介莫涛大神创造出的离线询问算法的带修改版。算法基础：需要掌握莫队算法，会打暴搜（暴力）。一个叫莫的双端队列。只支持单点修改操作方法普通的不带修改的莫队算......
排序算法之稳定性
介绍稳定性：2个相等的数，在排序前后的顺序不变，就说这个排序算法是稳定。好处从一个键上排序，然后再从另一个键上排序，第一个键排序的结果可以为第二个键排序所用。例子基......
manjaro安装有道云笔记
我在使用debtap过程中，可以安装！但是竟然更新不了！真是绝了！所有我就在网上找到了有道云笔记的软件的英文名字——ynote-desktop使用yay ynote-desktop查找软件包，随后：会出现......
寒武纪招聘|智能驾驶类、算法类、软件类、芯片类等岗位（校招/社招）
......
【电力系统】微电网两阶段鲁棒优化经济调度算法附matlab代码
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。......
angular学习笔记
*ngSwitch1.用法<div[ngSwitch]="num"><div*ngSwitchCase="0">0</div><div*ngSwitchCase="1">1</div><div*ngSwitchDefault>默认的</div></di......
地震储层预测笔记—AVO近似公式总结
地震储层预测笔记—AVO近似公式总结(一).Zeoppritz方程AVO地球物理基础是平面弹性波在层状介质下推倒得出的Zeopprizt方程，在两层介质下（如图1所示）其Zeopprizt方程可以写......
特征提取算法的综合实验（多种角度比较sift/surf/brisk/orb/akze）
一、基本概念：作用：特征点提取在“目标识别、图像拼接、运动跟踪、图像检索、自动定位”等研究中起着重要作用；主要算法：•FAST,Machine......
基于加权人工鱼群算法的深空天线定位PID控制器优化设计附matlab代码
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。......
【其他算法】配对关系转组+非极大值抑制
defget_group_from_pair(pair_list):"""功能:根据成对的关系，获得group输入:对关系list,如[[1,3],[2,3],[4,5],[3,6],[6,8]]输出:组关系lis......

CTC算法学习笔记

CTC算法

引入占位符

模型

相关文章

赞助商

阅读排行