说实在的Pyhon在数据处理方面确实很牛。尤其是大数据的今天,我们和形形色色的数据形影不离。本文给大家介绍下利用百度OCR进行文字识别。
实验环境
- Python (3.9.12)
- Kali Linux
- 百度OCR
申请百度OCR
访问百度智能云,开通API
网址:https://cloud.baidu.com/campaign/OCR202203/index.html
可以使用百度账号登录,使用百度登录的好处是,你可以把百度的实名认证直接迁移过来,就不需要再等几天人工审核了。
你可以选择免费试用,或者1块钱买1万次,我觉得没什么区别,都是够用的。
领取免费额度的时候要勾选接口类型,要不然是一片空白。
新建应用,获取token
在控制台
-文字识别
-概览
中点击创建应用
应用归属选择个人,应用名称和概述就随便填
创建完成之后,进入应用列表,可以看到API Key
和Secret Key
,记下来。
文字识别
根据官方示例,写了Python的简单列子。参考如下:
from aip import AipOcr
APP_ID = 'xxxxxx'#你的APP_ID
API_KEY = 'xxxxxxxxx'#你的API_KEY
SECRET_KEY = 'xxxxxxxx'#你的SECRET_KEY
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('/root/img/44.jpg')
result = client.basicGeneral(image)
for item in result['words_result']:
print(item['words'])
识别车牌号
效果如下:
识别行程码
其他
在此基础上,我们可以深度开发。比如批量处理文件夹中的图片,并将其图片中的文字信息导出到Excel中。后期有时间深度研究下吧。
标签:识别,图像识别,Python,APP,API,KEY,OCR,百度 From: https://blog.51cto.com/dabiaoge/7201356