PPadleOCR 自己的数据训练

时间：2023-12-09 17:44:06浏览次数：28

标签：cn 训练 python 数据 tsinghua https edu 安装 PPadleOCR

在github里面下载PaddleOCR源码后，接下来开始一一安装：
1、安装Python，此处必须安装3.8--3.10的版本，3.11版本目前是不支持的，容易报错。

2、依次安装

python -m pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple

python -m pip install PPOCRLabel -i https://pypi.tuna.tsinghua.edu.cn/simple -- 标注工具

PPOCRLabel --lang ch

在此安装过程中有两个依赖，得注意安装：
ModuleNotFoundError: No module named 'Polygon'
这个安装时，必须使用 python -m pip install Polygon3 -i https://pypi.tuna.tsinghua.edu.cn/simple

ModuleNotFoundError: No module named 'lanms'

这个安装时，必须使用 python -m pip install lanms-nova -i https://pypi.tuna.tsinghua.edu.cn/simple

3、在标注工具里面识别后，及时保存相关数据。

4、下载训练模型

根据自己的需要下载 https://github.com/PaddlePaddle/PaddleOCR ：

5、修改训练的配置文件：

6、标记train 下的文件

修改之前识别有问题的label文件，标记为正确的。

7、执行命令（建议路径用完全路径）

python tools/train.py -c configs/det/det_mv3_db.yml

部分参数一定设置小，否则个人电脑容易硬件性能不足的报错。

标签：cn,训练,python,数据,tsinghua,https,edu,安装,PPadleOCR
From： https://www.cnblogs.com/zhongjicainiao/p/17891247.html

数据结构--二叉树的生成和遍历（9）
好久没有更新博客了，关于二叉树也查了不少资料，下面写上我对二叉树的理解。一、什么是二叉树二叉树是一种树形结构，其中每个节点的叶子节点不超过两个，而且二叉树的左右子树是有顺序的，顺序不能颠倒如下图所示，一下四种都属于二叉树。二、特殊的二叉树1.满二叉树：听名......
【JavaSE】数据结构（栈、队列、数组、链表）
什么是数据结构？数据结构是计算机底层存储、组织数据的方式，是指数据相互之间是什么方式排列在一起的常见的数据结构栈、队列、数组、链表二叉树、二叉查找树、平衡二叉树、红黑树哈希表栈特点：先进后出队列特点：先进先出数组特点：有索引，内存连续优点：查询速度快O(1)缺点：增......
【JavaSE】数据结构（树：二叉查找树、平衡二叉树、AVL树、红黑树）
树度：每个节点的子节点数量树高：树的总层数根节点：入度为0的节点二叉树每个节点最多有两个子节点二叉查找树任意节点左子树上的节点都小于当前节点，右子树上的节点都大于当前节点平衡二叉树任意节点的左右子树的高度差不超过1AVL树AVL树是一种平衡二叉树，得名于其发明者的......
【JavaSE】数据结构-哈希表（HashSet/HashMap底层哈希表详解，源码分析）
哈希表结构JDK8版本之前：数组+链表JDK8版本及之后：数组+链表+红黑树哈希表HashMapput()方法的添加流程创建HashSet集合时，构造方法中自动创建HashMap集合；HashMap空参构造方法会创建一个默认长度为16，默认加载因子为0.75的数组，数组名为table（tips：实际上，HashSet对象创建后，第......
Redis数据结构2：REDIS_STRING（SDS）
REDIS_STRING(SDS)SDS全称SimpleDynamicString(简单动态字符串)，是专为Redis设计的简易字符串实现。Redis并未采用C语言传统字符串char*，而是自己设计了一套字符串实现标准。传统字符串的缺陷C语言字符串实际上就是一个以'\0'结尾的字符数组。例如：char*myName="ErickRen";......
[数据启示录 02] 堆栈
堆栈（stack）是一种基于后进先出（LIFO，LastInFirstOut）原则的数据结构。它模拟了现实生活中的堆栈，类似于一摞盘子或一堆书。堆栈有两个基本操作：入栈（push）和出栈（pop）。入栈（push）：将新元素添加到堆栈的顶部。新元素成为当前堆栈的最上面一个元素。出栈（pop）：从堆栈的顶部移除最上面的元素，并返回......
[数据启示录 02] 堆栈
堆栈（stack）是一种基于后进先出（LIFO，LastInFirstOut）原则的数据结构。它模拟了现实生活中的堆栈，类似于一摞盘子或一堆书。堆栈有两个基本操作：入栈（push）和出栈（pop）。入栈（push）：将新元素添加到堆栈的顶部。新元素成为当前堆栈的最上面一个元素。出栈（pop）：从堆栈的顶部移除最上面的元素，并返回......
数据库注入攻击
数据库注入攻击基于union联合查询的注入判断字段名数量使用orderby确定字段数id=1orderby字段数使用unionselect确定字段数id=1unionselect1,2,3.....查询当前数据库名及数据库信息id=1unionselectversion(),database()查询数据库中的表id=1unionselec......
【Base64】二进制数据编码解码（OpenSSL BIO）
1.问题引出计算机中数据使用ascii码存储，而ascii码在128~255之间是不可见字符，网络上传输数据时往往经过多个路由设备，不同设备不同的处理方式也可能导致数据传输过程中处理出现问题。所以我们通过Base64将数据全部编码成可见字符（A-Z,a-z,0-9,+,/共64个）可以降低出错的可能。B......
如何利用OPeNDAP快速读取格点数据——以GFS为例
国内的气象圈子对于OPeNDAP这个单词应该是既熟悉又陌生，熟悉就熟悉在它出现频率很高，感觉好像哪哪儿都提到了它；而陌生就陌生在平时实际工作中好像又很少真正用过它。事实上OPeNDAP是一个可以极大提高格点数据传输和使用效率的“工具”，当初我第一次体验这个东西的时候就发出了“......

PPadleOCR 自己的数据训练

相关文章

赞助商

阅读排行