首页 > 其他分享 >小白也行的:Easy OCR做一款免费的图片转文字

小白也行的:Easy OCR做一款免费的图片转文字

时间:2024-02-15 12:44:05浏览次数:28  
标签:python text cmd 小白 Easy pip OCR 安装 下载

\text{EasyOCR} 支持超过 $80$ 种语言的识别,包括英语、中文(简繁)、阿拉伯文、日文等,并且该库在不断更新中,未来会支持更多的语言。像市面上所有的图片识别都用的是 $\text{OCR}$,如微信,百度。个人推荐软件:微信,网站https://web.baimiaoapp.com,该网站识别准确率是真的高,且收费也很人性化,使用后期仍然可以一天免费扫 $5$ 张。

$\text{OCR}$ 的扫描过程:

废话不多说,开始演示。

1.安装 $\text{python}$

由于 $\text{python}$ 代码短,功能强大,所以编译器选择了 $\text{python}$。有 $\text{python}$ 的忽略这一步,注意非 $\text{python3.9}$ 可能会出现错误。

进入https://www.python.org/downloads/release/python-3913/,拉到最底下。

电脑 $32$ 位的下上面这个,$64$ 位的下下面这个。

双击打开,这里用了 $3.7.4$ 的图,步骤一,最好两个都钩选,但必须勾选下面那个。

出现 $setup\ was\ successful$,安装成功。

安装完后,$win+r$,输入cmd,在 $\text{cmd}$ 内输入 python,会弹出如下界面,如果您安装了 $\text{python}$ 但在 $\text{cmd}$ 内输入 python 没有如图文字,请重新安装。

2. 安装 $\text{pip}$

前置知识,$\text{cmd}$ 命令:

cd 文件夹名 打开这个文件夹。

cd.. 返回上一层目录。

盘符名: 进入到某个盘,如进入到 $F$ 盘为 F:

安装 $\text{pip}$,在该题内下载附件pip-23.0.tar.gz 并解压,把路径复制下来。

然后进入到 $\text{cmd}$。

注意:你下载在什么盘,最好先输入 盘符:

进入 你下载的那个盘后,cd 刚才复制的内容,回车。再将 python setup.py install 复制下来,在 $\text{cmd}$ 粘贴,回车。

然后就会开始安装,大约 $5$ 秒钟。安装完后,输入 pip,若没有报错,即成功。
以下是安装完后,输入 pip,成功画面,若报错,请重新安装 $\text{python}$。

3.安装 $\text{EasyOCR}$

按 $\text{cmd}$ 的方法,进入到 $\text{python}$ 的 $\text{Scripts}$ 文件夹,输入 pip install easyocr -i https://pypi.tuna.tsinghua.edu.cn/simple,出现进度条即开始安装,如图。

安装完成:

4.使用 $\text{EasyOCR}$

首先,把这张图片下载下来,重命名为 $\text{test.png}$。

放在你当前登录的用户的文件夹里。如:

打开 $\text{cmd}$,输入 python

输入:

# 导入easyocr
import easyocr
# 创建reader对象
reader = easyocr.Reader(['ch_sim','en']) 
# 读取图像
result = reader.readtext('test.png')
# 结果 result
for i in result:
    word = i[1]
    print(word)


print(word) 后面还有两个换行,但好像没出来,请自行添加。也可以在该题内下载 py.txt,代码同上。

$\text{test.png}$ 是打开文件名,可以自行更改。

第一次使用会下载语言,'ch_sim','en',是中文和英文,如果要下载其他语言,按照该表更改:

这两个进度条就是下载语言,以后使用不在出现。

如果发现无法自动下载,可以进入网址https://www.jaided.ai/easyocr/modelhub/,直接下载,下载下来的压缩包不用解压,直接放在 $\text{~/.EasyOCR/model/}$ 目录下。具体下载哪个语言包,代码中下载英文和中文,是 $\text{ch_sim}$,与 $\text{en}$ 下载其他语言可根据上文表中的代号一栏更改。

识别结果:

准确率是不是很高啊。用 $\text{EasyOCR}$ 做最简单的图片识别。

标签:python,text,cmd,小白,Easy,pip,OCR,安装,下载
From: https://www.cnblogs.com/shootdown/p/18016161

相关文章

  • C1. Good Subarrays (Easy Version)
    找子数组的个数双指针#include<bits/stdc++.h>#defineintlonglongusingnamespacestd;constintN=2e5+10;inta[N];voidsolve(){ intn; cin>>n; for(inti=1;i<=n;i++)cin>>a[i]; intl=1,r=1; intans=0; while(l<=r){ if(l>n||r>......
  • 小白入门clang_format
    如果没时间研究折腾,可以接受这样↓的风格 那么安装这个↓,默认在代码界面按alt+shift+f即可 ========================================================== 如果你想稍微个性化一点在上面的基础上,做以下配置 什么意思自己看上面↑截图的文字介绍 如何回到代码界面按a......
  • C#文字识别OCR识别率99.9%
    最近遇到一个需求:有大量的扫描件需要还原为可编辑的文本,很显然需要用到图片OCR识别为文字技术。本来以为这个技术很普遍的,结果用了几个开源库,效果不理想。后来,用了取巧的方法,直接使用了WX的OCR识别模型,因为发现WX电脑端的OCR识别真是黑科技啊,好用的很!识别率99.9%,并且是本地识别,不......
  • springboot集成easypoi导出多sheet页
    pom文件<dependency> <groupId>cn.afterturn</groupId> <artifactId>easypoi-base</artifactId> <version>4.1.0</version></dependency>导出模板:编辑后端代码示例:/***导出加油卡进便利店大额审批列表*@throwsIOException......
  • 2024牛客寒假算法基础集训营2(小白)
    A.TokitsukazeandBraceletCode:#include<bits/stdc++.h>usingnamespacestd;intmain(){intt;cin>>t;while(t--){inta,b,c,cnt=0;cin>>a>>b>>c;if(a>=150)cnt++;if(a>=200)......
  • 关于easyExcel解析未添加@ExcelProperty报错问题分析
    在一次做辅料商品导出列表的需求,并且上线之后发现,怎么商品列表的导出没有反应,一看日志,发现报错了:这里新加了两个字段用于做转换使用。因为之前很少用easyExcel,所以以为只要不加@ExcelProperty,easyExcel就不会去解析字段,没想到easyExcel还是去做了解析。源码分析通过上面的......
  • opencv OCR检测:EAST
    加载east模型进行文本检测模型下载https://codeload.github.com/oyyd/frozen_east_text_detection.pb/zip/refs/heads/master#coding:utf-8importcv2importmath############Utilityfunctions############defdecode(scores,geometry,scoreThresh):detection......
  • 牛客周赛 Round 31(很菜的小白)
    A.小红小紫替换思路:签到题,字符串如果是kou就替换成yukari取余不变解法:无Code:#include<bits/stdc++.h>usingnamespacestd;intmain(){strings;std::cin>>s;std::cout<<(s=="kou"?"yukari\n":s)<<'\n&#......
  • EasyExcel读取resources下多个excel文件的解决办法
    最近新的业务是需要读取resources下的excel文件并入库,没有做过类似的所以踩了很多坑话不多说开始:使用ResourcePatternResolver解析该目录下的多个excel文件  读取之后直接使用EasyExcel读取文集文件并且转换为实体对象,这里只需要注意些一个ExcelListener()监听器,具体怎么写这......
  • Japan Registry Services (JPRS) Programming Contest 2024 (AtCoder Beginner Contes
    //这一场我感觉有了新的蜕变思考问题也变了多种,3题(✌)A-TLD思路:题目本意 Youaregivenastring S, Printthelastsubstringwhen S issplitby .s给你一个字符串输出最后的点的网址(类似)的后缀,入坑点没有,题意简单。思路方法:最后一个‘.’为停止符号,倒的字符串......