PaddleOCR

2024-11-02python - 小袁口算ocr
按照模拟器位置捕捉截图，使用paddleocr识别数字后比较大小importpyautogui,timefrompaddleocrimportPaddleOCRpaddleocr=PaddleOCR(lang='en',show_log=False,use_angle_cls=True)defcapture_screenshot(region=None):img=pyautogui.screenshot(region=regio
2024-10-30memo
paddleocr的C++推理onnxruntime的C++部署yolo8-seg的C++版onnxruntime推理案例1yolo8-seg的C++版onnxruntime推理案例2paddleocr的C++版onnxruntime推理案例u-net的C++版onnxruntime推理案例
2024-10-09如何自己动手实现一个图片解答小助手
有一张图片如下所示：Kimi上有一个功能，就是解析图片内容，给出回答：这样可以用于拍照向AI提问的场景，我自己也有这方面的需求，因此动手实践了一下。自己动手实现的效果如下所示：那么自己如何实现呢？可以通过添加一个OCR的功能来实现。中文图片文字识别也就是OCR效果比较好的是百度
2024-09-27安装paddleocr失败，重新安装
删除冲突文件rm-f/Library/Frameworks/Python.framework/Versions/3.9/lib/python3.9/site-packages/paddle/base/libpaddle.so彻底卸载paddlepaddlepip3uninstallpaddlepaddlepip3uninstallpaddlepaddle-gpu清除pip的缓存pip3cachepurge使用--verbose
2024-09-23docker部署paddleocr过程中遇到的问题
坑1：尝试了下面csdn博客中的解决方案，但是不太行，后来发现是paddlepaddle-gpu的版本问题，版本改对后就OK了https://blog.csdn.net/weixin_43021830/article/details/128243800坑2：困扰了一周了，还是卡住了，目前尝试解决的两个思路1、将paddleocr模块添加到python解释器的搜索路径
2024-09-07python PaddleOCR库用法及知识点详解
识别图片的设置https://blog.csdn.net/f2315895270/article/details/128147744?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-0-128147744-blog-89082526.pc_relevant_default&spm=1001.2101.3001.4242.1&utm_relevant_in
2024-08-27超赞！PaddleOCR在国产麒麟系统中的离线绿色部署
一、背景在信创（信息技术应用创新）背景下，OCR（OpticalCharacterRecognition，光学字符识别）技术的需求日益增长，主要体现在以下几个方面：首先，随着国家信创战略的推进，自主可控和信息安全成为关键议题。OCR技术作为信息技术的重要组成部分，其国产化、自主可控的需求日益迫切。这要求OCR技
2024-08-11paddleocr_paddle_onnxruntime
paddleocr_paddle论文PaddleOCR通过det、rec、cls三个模型分别实现字符检测、字符识别和字符方向分类的应用det模型主要用DB算法，参考论文如下：https://arxiv.org/pdf/1911.08947.pdfrec模型主要用SVTR算法，参考论文如下：https://arxiv.org/pdf/2205.00159.pdfcls模型用mobi
2024-07-27【模型训练-1】【Windows-PaddleOCR-ocr模型训练（CPU）】数据标注
模型训练使用ocr的使用对硬件设备有比较高的依赖。网上下的模型没有GPU的加持识别效率不高，完成自有模型的训练在相同硬件设备的基准上能大大提高识别效率，加速脚本执行效率。看一组数据：训练了自己的模型识别耗时1000ms，相同的图片网上随便下的模型4000ms接下来可以根据
2024-07-24飞桨PaddleOCR-动手学OCR
技术背景在人工智能的浪潮中，OCR（OpticalCharacterRecognition，光学字符识别）技术作为一项关键技术，正在不断地推动着信息获取和处理的自动化和智能化。飞桨PaddleOCR，作为百度飞桨推出的一款开源OCR工具库，以其强大的识别能力、灵活的应用场景和易用的接口设计，成为开发者和研
2024-07-19paddleocr识别并按行输出结果
frompaddleocrimportPaddleOCR#初始化OCR引擎ocr=PaddleOCR(use_angle_cls=True,lang="ch")#使用中文模型#对图像进行OCR识别img_path='./imgs/img_3.png'result=ocr.ocr(img_path,cls=True)#按y坐标对文本块进行排序sorted_result=sorted(result,
2024-07-05文字识别技术升级：Airtest与PaddleOCR模型的协作小技巧
此文章来源于项目官方公众号：“AirtestProject”版权声明：允许转载，但转载必须保留原链接；请勿用作商业或者非法用途一、前言在进行自动化测试的过程中，ocr文字识别一直是大家最想要实现以及最需要的能力，今天就来介绍一个由百度飞浆提供的一个免费的ocr识别库——PaddleOCR，以及探
2024-07-01paddleocr识别表格文字内容，对表格内容进行从左上到右下排序
背景：使用paddleocr识别表格图片文字内容，但是由于图片拍摄或扫描角度问题，不一定是水平平衡的，可能存在一定的倾斜角度。所以如果是仅按坐标从左上到右下进行排序的话，可能本来同一行的文字，被切分成了上下行。因此需要使用阈值来进行近似判断。下面就是一个可用例子。defsort_to
2024-07-01有关paddleocr在pyinstall中打包问题的解决方案
借鉴网址python解决paddleocr打包问题_pyinstaller怎么解决paddleocr中的动态导入-CSDN博客在打包时我使用的spec文件如下：（需要将pathe和binaries换为自己的paddleocr路径）block_cipher=Nonea=Analysis(['main.py'], pathex=['E:\\PyEnviroment\\Lib\\site-packages\\p
2024-06-02C# PaddleOCR 单字识别效果
C#PaddleOCR 单字识别效果效果说明根据《百度办公文档识别C++离线SDKV1.2用户接入文档.pdf》，使用C++封装DLL，C#调用。背景为使客户、第三方开发者等能够更快速、方便的接入使用百度办公文档识别SDK、促进百度OCR产品赋能更多客户，
2024-05-29提速15%，PaddleOCRSharp新版v4.3发布
PaddleOCRSharpv4.3版本，已经于5月23日发布。该版本的发布，在不影响识别精度的同时，带来了10%~15%速度的提升。项目地址：https://gitee.com/raoyutian/PaddleOCRSharp项目简介PaddleOCRSharp 作者是广州英田信息科技有限公司的创始人明月心(raoyutian) ，是一个基于百度飞桨Padd
2024-05-26【ERNIE + PaddleOCR】创建自己的论文字典，更好的写论文吧！
一、项目背景在撰写论文的过程中，许多作者习惯先以中文完成初稿，随后再将其翻译为英文。然而，这种翻译过程往往伴随着一系列挑战。尤其是在词汇选择和语法结构上，很容易使用到一些在学术论文中不常用或不符合规范的表达。为了克服这一难题，我结合PaddleOCR和ERNIE
2024-04-17paddleocr文字识别
1.paddleocrPaddleOCR是一个基于PaddlePaddle深度学习框架的开源OCR（OpticalCharacterRecognition，光学字符识别）工具。它提供了一系列的预训练模型和工具，可以用于文本检测、文本识别和文本方向检测等任务。提供了易于使用的PythonAPI，可以轻松地在你的项目中集成
2024-04-14C#使用PaddleOCR进行图片文字识别
PaddlePaddle介绍✨PaddlePaddle（飞桨）是百度开发的深度学习平台，旨在为开发者提供全面、灵活的工具集，用于构建、训练和部署各种深度学习模型。它具有开放源代码、高度灵活性、可扩展性和分布式训练等特点。PaddlePaddle支持端到端的部署，可以将模型轻松应用于服务器、移动设备和边缘
2024-04-09C#使用PaddleOCR进行图片文字识别✨
PaddlePaddle介绍✨PaddlePaddle（飞桨）是百度开发的深度学习平台，旨在为开发者提供全面、灵活的工具集，用于构建、训练和部署各种深度学习模型。它具有开放源代码、高度灵活性、可扩展性和分布式训练等特点。PaddlePaddle支持端到端的部署，可以将模型轻松应用于服务器、移动设备和边缘
2024-03-15paddleocr 在docker环境下部署
paddleocr在docker环境下部署第一步查看cuda的版本nvcc-V,我的是11.2;nvidia-smi对应的cudaversion是11.6，所以采用了registry.baidubce.com/paddlepaddle/paddle:latest-dev-cuda11.6-cudnn8.4-trt8.4-gcc82作为基础镜像Docker镜像源选择，DockerHub地址Dockerfile
2024-03-15一点奇怪的想法——paddleocr复现使用
三个命令行安装paddleocrcondacreate-npaddle02python=3.8activetepaddle02pipinstallpaddlepaddle-ihttps://mirror.baidu.com/pypi/simplepipinstallpaddleocr-ihttps://mirror.baidu.com/pypi/simple大部分的应该是可以跑的测试代码#第一个简单测试的
2024-03-14PaddleOCR手写文字识别模型训练（摘抄所得，非原创）
1.安装环境#首先git官方的PaddleOCR项目，安装需要的依赖gitclonehttps://github.com/PaddlePaddle/PaddleOCR.gitcdPaddleOCRpipinstall-rrequirements.txt2.数据准备本项目使用公开的手写文本识别数据集，包含ChineseOCR,中科院自动化研究所-手写中文数据集CASIA-
2024-03-12python 使用PaddleOCR读取图片文字，并用pyttsx3转为音频
python小白，纯纯小白，很久之前看了一遍菜鸟官网，但实在没有应用场景，所以过目即忘。最近工作不是很忙，给我出了个题目，觉得挺有意思，就玩一玩。所以关键点就是，图片提取出文字，然后文字转音频。1.图片提取文字，PaddleOCR出题人士，给出了git上一个ocr的工具库，支持图文信息的抽取。用
2024-03-08PaddleOCR 服务化部署(基于PaddleHub Serving)
最近用到百度飞桨的PaddleOCR，研究了一下PaddleOCR的服务化部署，简单记录一些部署过程和碰到的问题。基础环境paddlepaddle2.5.2python3.7paddlehub2.1.0PaddleOCR2.6pip20#查看python版本python--version#查看pip版本pip--version#查看paddlepaddle版本