公式识别任务各个链条全部打通

时间：2023-12-09 21:56:30浏览次数：41

标签：LaTeX OCR 打通公式模型 https 链条识别

引言

随着LaTeX-OCR模型转换问题的解决，公式识别任务中各个链条已经全部打通。小伙伴们可以放开膀子干了。

解决业界问题的方案，并不是单独训练一个模型就完事了，而是有着上下游的依赖。这就像工厂中流水线作业一样，一个小东西的生产是依赖无数个中间阶段才完成的。

一个模型应用到产品中，也是有着类似的流水线的。相比于工厂中流水线，这里的链条只是更加隐蔽一些而已。

公式识别任务是什么？

公式识别任务：指的是将图像中公式识别为对应的LaTeX写法，便于后续加工处理。

公式识别任务距离我们最近的应用场景便是论文写作。在我上大学写毕业论文时，由于当时并不知道LaTeX这种东西可以用来写公式，整个毕业论文公式都是在Word上用鼠标点出来的，好不痛苦。

比较推荐大家学一学LaTeX排版，绝对是提效利器，用过的人都说好。

动图来自LaTeX-OCR

公式识别任务解决方案初探

解决公式识别任务，我这里姑且粗略地分为四个部分：公式识别数据集处理、训练识别模型、转换识别模型和部署使用。

取之开源，回馈开源，一直是我们的准则。以上四部分具体地址如下，除训练识别模型为lukas-blecher外，其余均经由我整理。欢迎大家多多使用和提建议。

预处理公式库ProcessLaTeXFormulaTools: https://github.com/SWHL/ProcessLaTeXFormulaTools

训练识别模型库LaTeX-OCR: https://github.com/lukas-blecher/LaTeX-OCR

转换模型为ONNX格式库ConvertLaTeXOCRToONNX: https://github.com/SWHL/ConvertLaTeXOCRToONNX

部署使用库RapidLaTeXOCR: https://github.com/RapidAI/RapidLaTeXOCR

使用建议

先尝试RapidLaTeXOCR中识别模型识别效果，是否满足场景需求。

如果不满足，再考虑结合自身场景，将上述四部分走一遍，定制化自己的公式识别模型。

写在最后

本篇文章只是简单介绍，具体请移步文中各个部分的仓库下查看。

如有具体微调，部署等需求，欢迎后台详细咨询。

标签：LaTeX,OCR,打通,公式,模型,https,链条,识别
From： https://www.cnblogs.com/shiwanghualuo/p/17891561.html

抖音的暂停识别画面的功能
我是卢松松，点点上面的头像，欢迎关注我哦！在不影响用户体验的情况下，理论上把每一条视频都变成了带货视频，一旦这个习惯形成，一定是一个超级大的电商流量入口。最近抖音在内测一个新功能，如下图所示，你先点开一条视频，点暂停，然后就会出现视频里的产品了。如果你喜欢这件衣服，也可以直接在搜索......
体育产业中的图像识别创新：运动分析与训练优化
在现代体育产业中，图像识别技术正成为一项重要的创新，为运动员的表现分析、训练优化和比赛策略提供了全新的视角。以下是体育产业中图像识别创新的一些关键应用和优势：1. 运动员动作分析：动作精准度评估：图像识别技术可用于捕捉运动员的关键动作，分析动作的精准度和流畅度，为提高......
反光衣穿戴监测识别系统
反光衣穿戴监测识别系统基于AI的人工智能机器视觉分析识别技术，基于AI视觉智能分析算法，通过现场摄像头对工地进行24小时不间断的监测。一旦发现未穿戴反光衣的风险行为，系统会在实时视频画面中框出该人员，并进行抓拍截图，同时记录下违规行为。系统可以最大程度地......
机动车合格证二维码识别
机动车合格证二维码识别在线测试http://123.56.191.160:7002/代码调用pythonimportrequestsurl="http://123.56.191.160:7000/service?token=3e2b020812804339be4627c29e731fc4"payload="ZCCCHGZ_V3.1141030#1088|C206A00123194EDE5725C075XXXXXXXXXXXXXXXXXXXXXXX......
摔倒监测识别系统
摔倒监测识别系统基于神经网络人工智能视觉算法技术，利用现场已经装好的监控摄像头对监测区域内的场景进行实时视频监测。自动对视频图像信息进行分析识别，无需人工干预。当遇到跌倒这类紧急情况，系统能够迅速识别出异常情况，以最快的方式进行预警提醒。可对常去区......
@SpringBootTest 和 @RunWith 注解不能识别单元测试第一步引入maven依赖
@SpringBootTest和@RunWith注解不能识别单元测试第一步引入maven依赖一、背景最近在预研 Rocketmq，在写小例子的时候，需要编写测试代码，突然间发现我的 @SpringBootTest 和 @RunWith 这两个注解不能识别，于是展开了我的问题排查过程。问题截图如下：二、问题排......
钓鱼邮件演练：如何识别和防范网络钓鱼攻击？
跟着互联网的普及和信息技术的快速发展，网络垂钓进犯已经成为一种常见的安全威胁。垂钓邮件是其间最常见的一种方式，经过伪装成正规组织或个人，拐骗受害者走漏个人信息或资金。本文将介绍垂钓邮件的特色、损害及怎么进行防备，协助咱们更好地维护自己的隐私和产业安全。一、垂钓邮件的......
安全帽佩戴识别系统
安全帽佩戴识别系统用深度视觉分析技术对现场监控画面实时分析，依据现场已经部署的监控摄像头，实时监测识别现场的工作环境，分析工作人员是否佩戴安全帽，自动对施工作业区域的员工进行识别，如发现未按要求佩戴安全帽，会立即发出语音提醒；后台监控人员收到违规提示后立......
使用Python代码识别股票价格图表模式
在股票市场交易的动态环境中，技术和金融的融合催生了分析市场趋势和预测未来价格走势的先进方法。本文将使用Python进行股票模式识别。fromcollectionsimportdefaultdictimportnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltfromscipy.signalim......
行业安卓主板-基于RK3568/3288/3588的电子班牌/人脸识别门禁/室内对讲门禁方案解决方
电子班牌智能电子班牌可在主页实时显示班级全面的基本信息，包括天气、班名、课程表、值日表等，并发布学校通知、班级通知。学生可刷卡自动登陆系统进行课堂反馈，教师和家长可及时了解教学反馈，打通学校、教师、学生之间的互动通道。人脸识别门禁智能人脸识别门禁已成为当下最热门的人工......

公式识别任务各个链条全部打通

引言

公式识别任务是什么？

公式识别任务解决方案初探

使用建议

写在最后

相关文章

赞助商

阅读排行