java实现 百度OCR 图片文字识别
最近在做一个扫描图片识别文字的功能,决定用百度AI开发平台完成
1 打开网址
打开地址:https://ai.baidu.com/
手机验证码登录
2 选择通用文字识别
开放能力-> 文字识别->通用文字识别
3 进入到通用文字识别页面
4 API的调用使用方式
(1) 首先进入点击 免费尝鲜 领取资源接口
注: 如果没有实名认证,需要用手机实名认证一下即可
(2)继续点击 第二个 创建应用
(3)服务调用
官方调用方式: https://cloud.baidu.com/doc/OCR/s/Ck3h7y2ia
通用文字识别调用方式:https://cloud.baidu.com/doc/OCR/s/zk3h7xz52
测试案列:
import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.jfinal.club.util.baidu.Base64Util;
import com.jfinal.club.util.baidu.FileUtil;
import com.jfinal.club.util.baidu.HttpUtil;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import java.util.List;
import java.util.Map;
/**
* @Date: 2023/9/20 12:38
* @Description: 百度文字识别
*/
public class BaiduOCR {
/**
* 获取权限token
* @return 返回示例:
* {
* "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
* "expires_in": 2592000
* }
*/
public static String getAuth() {
// 官网获取的 API Key 更新为你注册的
String clientId = "fZGbeAxB02UsgGH7oo8f528T";
// 官网获取的 Secret Key 更新为你注册的
String clientSecret = "lrDZxhT1kz1V4fcdcuc8gvf7AP3KWpWl";
return getAuth(clientId, clientSecret);
}
/**
* 获取API访问token
* 该token有一定的有效期,需要自行管理,当失效时需重新获取.
* @param ak - 百度云官网获取的 API Key
* @param sk - 百度云官网获取的 Securet Key
* @return assess_token 示例:
* "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
*/
public static String getAuth(String ak, String sk) {
// 获取token地址
String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
String getAccessTokenUrl = authHost
// 1. grant_type为固定参数
+ "grant_type=client_credentials"
// 2. 官网获取的 API Key
+ "&client_id=" + ak
// 3. 官网获取的 Secret Key
+ "&client_secret=" + sk;
try {
URL realUrl = new URL(getAccessTokenUrl);
// 打开和URL之间的连接
HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
connection.setRequestMethod("GET");
connection.connect();
// 获取所有响应头字段
Map<String, List<String>> map = connection.getHeaderFields();
// 遍历所有的响应头字段
for (String key : map.keySet()) {
System.err.println(key + "--->" + map.get(key));
}
// 定义 BufferedReader输入流来读取URL的响应
BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
String result = "";
String line;
while ((line = in.readLine()) != null) {
result += line;
}
/**
* 返回结果示例
*/
//System.err.println("result:" + result);
JSONObject jsonObject = JSON.parseObject(result);
String access_token = jsonObject.getString("access_token");
return access_token;
} catch (Exception e) {
System.err.printf("获取token失败!");
e.printStackTrace(System.err);
}
return null;
}
public static String generalBasic() {
// 请求url
String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";
try {
// 本地文件路径
//String filePath = "[本地文件路径]";
String filePath = "D:\\abc.webp";
byte[] imgData = FileUtil.readFileByBytes(filePath);
String imgStr = Base64Util.encode(imgData);
String imgParam = URLEncoder.encode(imgStr, "UTF-8");
String param = "image=" + imgParam;
// 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
//String accessToken = "[调用鉴权接口获取的token]";
String accessToken = getAuth();
String result = HttpUtil.post(url, accessToken, param);
return result;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
public static void main(String[] args) {
String s = generalBasic();
JSONObject j = JSON.parseObject(s);
String text = j.getJSONArray("words_result").getJSONObject(0).getString("words");
System.out.println(text);
}
}