paddleOcr 训练自定义数据

时间：2023-06-02 12:05:31浏览次数：56

标签：ch 定义数据训练 python paddleOcr paddlepaddle v2.0 https

paddleOcr 训练自定义数据

文章目录

paddleOcr 训练自定义数据
前言
一、创建环境
二、安装环境
三、使用ppocrlabel标注图片

1.打开图片目录
2.导出标记结果、导出识别结果

四、训练

1.切分数据
2.修改训练的模型 yml
3.开始训练

五、已经训练的模型，有了新数据需要继续训练

1.使用恢复训练
2.使用迁移学习

总结

前言

环境

python: 3.7.5

paddlepaddle-gpu: 2.2.2

paddleocr: 2.4.0.1

#paddlepaddle
https://www.paddlepaddle.org.cn/
#paddleocr
https://github.com/PaddlePaddle/PaddleOCR
https://gitee.com/paddlepaddle/PaddleOCR

paddleocr 有三种模型 det 检测 cls 方向 rec 识别

一、创建环境

安装miniconda

创建环境

#linux 需要先 source
conda create -n paddle_ocr python=3.9.7  --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

安装完以后进入环境

conda activate paddle_ocr

二、安装环境

paddlepaddle

#去官网找到适合自己环境的版本  windows
python -m pip install paddlepaddle-gpu==2.2.2.post112 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html
#linux
python -m pip install paddlepaddle-gpu==2.2.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

paddleocr

#安装paddleocr
python -m pip install paddleocr
cd <paddleocr_path>/
#下载源代码
git clone https://gitee.com/paddlepaddle/PaddleOCR.git
cd PaddleOCR/
#安装依赖
python -m pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
#需要用到 PPOCRLabel 标注
cd PPOCRLabel/
python -m pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

测试一下

paddleocr --image_dir ./doc/imgs/11.jpg --use_angle_cls true

paddleOcr 训练自定义数据_python

选择模型
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.4/doc/doc_ch/models_list.md我使用的模型是

ch_ppocr_server_v2.0
det： ch_det_res18_db_v2.0.yml
rec:  rec_chinese_common_train_v2.0.yml
cls:  ch_ppocr_mobile_v2.0_cls

三、使用ppocrlabel标注图片

cd 到 ppocrlabel 目录下，python PPOCRLabel.py --lang ch

1.打开图片目录

2.导出标记结果、导出识别结果

paddleOcr 训练自定义数据_paddlepaddle_02

文件名	说明
Label.txt	检测标签，可直接用于PPOCR检测模型训练。用户每确认5张检测结果后，程序会进行自动写入。当用户关闭应用程序或切换文件路径后同样会进行写入。
fileState.txt	图片状态标记文件，保存当前文件夹下已经被用户手动确认过的图片名称。
Cache.cach	缓存文件，保存模型自动识别的结果。
rec_gt.txt	识别标签。可直接用于PPOCR识别模型训练。需用户手动点击菜单栏“文件” - "导出识别结果"后产生。
crop_img	识别数据。按照检测框切割后的图片。与rec_gt.txt同时产生。

四、训练

1.切分数据

首先cd 到 PPOCRLabel 目录下

python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath <数据地址>

执行完后，会在上一级目录，也就是 PPocr目录下生成 train_data

2.修改训练的模型 yml

3.开始训练

python tools/train.py -c configs/rec/ch_ppocr_v2.0/rec_chinese_common_train_v2.0.yml

五、已经训练的模型，有了新数据需要继续训练

1.使用恢复训练

修改配置文件中的 epoch_num

指定恢复训练的节点

python tools/train.py -c configs/det/ch_ppocr_v2.0/ch_det_res18_db_v2.0.yml -o Global.checkpoints=output/ch_db_res18/best_accuracy

2.使用迁移学习

训练的时候指定 pretrained_model 为上一次训练的输出

总结

标签：ch,定义数据,训练,python,paddleOcr,paddlepaddle,v2.0,https
From： https://blog.51cto.com/u_16015778/6401421

Pytorch 分布式训练
PytorchDDP分布式训练介绍近期一直在用torch的分布式训练，本文调研了目前Pytorch的分布式并行训练常使用DDP模式(DistributedDataParallell )，从基本概念，初始化启动，以及第三方的分布式训练框架展开介绍。最后以一个Bert情感分类给出完整的代码例子：torch-ddp-examples。基本......
代码随想录算法训练营第二十三天|669. 修剪二叉搜索树
[参考链接]669.修剪二叉搜索树 [代码]1#Definitionforabinarytreenode.2#classTreeNode(object):3#def__init__(self,val=0,left=None,right=None):4#self.val=val5#self.left=left6#self.right=right......
OCR -- 文本检测 - 训练DB文字检测模型
百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统预测部署简介与总览百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统PaddleInference模型推理（离线部署）百度飞桨(PaddlePaddle)-PP-OCRv3文字检测识别系统基于PaddleServing快速使用（服务化部署-CentOS）百度飞......
蓝桥杯----图论训练
STL当想要维护一个数组，其中的元素要求有序，同时可能随时对这个数组中的元素进行增减有没有一个STL可以快速维护一个这样的数组？multiset(平衡二叉树）默认从小到大排序注意离散化中清除重复元素的原理：unique()函数 vector......
Mysql训练营笔记
Mysql架构与内部模块演示环境：MySQL5.7存储引擎：InnoDB一、一条查询SQL是如何执行的？程序或者工具要操作数据库，第一步跟数据库建立连接。1、通信协议首先，MySQL必须要运行一个服务，监听默认的端口（3306）。通信协议MySQL支持多种通信协议。第一个就是TCP/IP协议，编......
代码随想录算法训练营第二十二天|235. 二叉搜索树的最近公共祖先,701. 二叉搜索树中的
[参考链接]235.二叉搜索树的最近公共祖先[注意]1.因为是有序树，所以如果中间节点是q和p的公共祖先，那么中间节点的数组一定是在[p,q]区间的。即中节点>p&&中节点<q或者中节点>q&&中节点<p。2.那么只要从上到下去遍历，遇到cur节点是数值在[p,q]区间中则一......
Spark技术在京东智能供应链预测的应用——按照业务进行划分，然后利用scikit learn进行
3.3Spark在预测核心层的应用我们使用SparkSQL和SparkRDD相结合的方式来编写程序，对于一般的数据处理，我们使用Spark的方式与其他无异，但是对于模型训练、预测这些需要调用算法接口的逻辑就需要考虑一下并行化的问题了。我们平均一个训练任务在一天处理的数据量大约在500G左右，虽然数......
word2vec (一) 简介与训练过程概要
词的向量化与word2vec简介word2vec最初是TomasMikolov发表的一篇文章[1]，同时开源了相应的代码，作用是将所有词语投影到K维的向量空间，每个词语都可以用一个K维向量表示。为什么要将词用向量来表示呢？这样可以给词语一个数学上的表示，使之可以适用于某些算法或数学模型。通常将词语表示......
docker部署PaddleOCR流程
先安装docker，输入docker-v后即可开始部署paddleocr1.容器环境使用ubuntu16.04dockerpullubuntu:16.042.启动容器使用-itd可以在后台运行正常-it就可以dockerrun-itd--name="paddleocr"ubuntu:16.04bash3.修改apt源（这里设置为清华源还不错）sed-i's/archive.ubun......
Python进行多输出（多因变量）回归：集成学习梯度提升决策树GRADIENT BOOSTING,GBR回归训练
原文链接： http://tecdat.cn/?p=25939最近我们被客户要求撰写关于多输出（多因变量）回归的研究报告，包括一些图形和统计输出。在之前的文章中，我们研究了许多使用多输出回归分析的方法。在本教程中，我们将学习如何使用梯度提升决策树GRADIENTBOOSTINGREGRESSOR拟合和预测多输出回归......

paddleOcr 训练自定义数据

paddleOcr 训练自定义数据

文章目录

前言

一、创建环境

二、安装环境

三、使用ppocrlabel标注图片

1.打开图片目录

2.导出标记结果、导出识别结果

四、训练

1.切分数据

2.修改训练的模型 yml

3.开始训练

五、已经训练的模型，有了新数据需要继续训练

1.使用恢复训练

2.使用迁移学习

总结

相关文章

赞助商

阅读排行