首页 > 编程语言 >java实现百度OCR图片文字识别

java实现百度OCR图片文字识别

时间:2023-09-20 18:11:10浏览次数:43  
标签:java String 获取 token import OCR com 百度

java实现 百度OCR 图片文字识别

最近在做一个扫描图片识别文字的功能,决定用百度AI开发平台完成

1 打开网址

​ 打开地址:https://ai.baidu.com/

image-20230920164534005

手机验证码登录

image-20230920164812899

2 选择通用文字识别

开放能力-> 文字识别->通用文字识别

image-20230920170126731

3 进入到通用文字识别页面

image-20230920170436092

4 API的调用使用方式

image-20230920170742243

(1) 首先进入点击 免费尝鲜 领取资源接口

注: 如果没有实名认证,需要用手机实名认证一下即可

image-20230920171100332

(2)继续点击 第二个 创建应用

image-20230920171641243

(3)服务调用

官方调用方式: https://cloud.baidu.com/doc/OCR/s/Ck3h7y2ia

通用文字识别调用方式:https://cloud.baidu.com/doc/OCR/s/zk3h7xz52

测试案列:

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.jfinal.club.util.baidu.Base64Util;
import com.jfinal.club.util.baidu.FileUtil;
import com.jfinal.club.util.baidu.HttpUtil;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import java.util.List;
import java.util.Map;

/**
 * @Date: 2023/9/20 12:38
 * @Description: 百度文字识别
 */
public class BaiduOCR {

    /**
     * 获取权限token
     * @return 返回示例:
     * {
     * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
     * "expires_in": 2592000
     * }
     */
    public static String getAuth() {
        // 官网获取的 API Key 更新为你注册的
        String clientId = "fZGbeAxB02UsgGH7oo8f528T";
        // 官网获取的 Secret Key 更新为你注册的
        String clientSecret = "lrDZxhT1kz1V4fcdcuc8gvf7AP3KWpWl";
        return getAuth(clientId, clientSecret);
    }

    /**
     * 获取API访问token
     * 该token有一定的有效期,需要自行管理,当失效时需重新获取.
     * @param ak - 百度云官网获取的 API Key
     * @param sk - 百度云官网获取的 Securet Key
     * @return assess_token 示例:
     * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
     */
    public static String getAuth(String ak, String sk) {
        // 获取token地址
        String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
        String getAccessTokenUrl = authHost
                // 1. grant_type为固定参数
                + "grant_type=client_credentials"
                // 2. 官网获取的 API Key
                + "&client_id=" + ak
                // 3. 官网获取的 Secret Key
                + "&client_secret=" + sk;
        try {
            URL realUrl = new URL(getAccessTokenUrl);
            // 打开和URL之间的连接
            HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
            connection.setRequestMethod("GET");
            connection.connect();
            // 获取所有响应头字段
            Map<String, List<String>> map = connection.getHeaderFields();
            // 遍历所有的响应头字段
            for (String key : map.keySet()) {
                System.err.println(key + "--->" + map.get(key));
            }
            // 定义 BufferedReader输入流来读取URL的响应
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            String result = "";
            String line;
            while ((line = in.readLine()) != null) {
                result += line;
            }
            /**
             * 返回结果示例
             */
            //System.err.println("result:" + result);
            JSONObject jsonObject =  JSON.parseObject(result);
            String access_token = jsonObject.getString("access_token");
            return access_token;
        } catch (Exception e) {
            System.err.printf("获取token失败!");
            e.printStackTrace(System.err);
        }
        return null;
    }


    public static String generalBasic() {
        // 请求url
        String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";
        try {
            // 本地文件路径
            //String filePath = "[本地文件路径]";
            String filePath = "D:\\abc.webp";
            byte[] imgData = FileUtil.readFileByBytes(filePath);
            String imgStr = Base64Util.encode(imgData);
            String imgParam = URLEncoder.encode(imgStr, "UTF-8");

            String param = "image=" + imgParam;

            // 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
            //String accessToken = "[调用鉴权接口获取的token]";
            String accessToken = getAuth();

            String result = HttpUtil.post(url, accessToken, param);
            return result;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return null;
    }

    public static void main(String[] args) {
        String s = generalBasic();
        JSONObject j = JSON.parseObject(s);
        String text = j.getJSONArray("words_result").getJSONObject(0).getString("words");
        System.out.println(text);
    }
}

(4) 结果

image-20230920175736076

标签:java,String,获取,token,import,OCR,com,百度
From: https://www.cnblogs.com/lccsdncnblogs/p/17718004.html

相关文章

  • 无涯教程-JavaScript - BETA.INV函数
    描述BETA.INV函数返回beta累积概率密度函数(BETA.DIST)的反函数。如果概率=BETA.DIST(x...TRUE),则BETA.INV(概率...)=x。在预期的完成时间和可变性的情况下,可以在项目计划中使用beta分布来建模可能的完成时间。语法BETA.INV(probability,alpha,beta,[A],[B])争论A......
  • javassist改类
    packageagent;importjavassist.CannotCompileException;importjavassist.ClassPool;importjavassist.CtBehavior;importjavassist.CtClass;importjava.io.*;publicclassTest{publicstaticvoidmain(String[]f)throwsIOException,CannotCompileEx......
  • Java课后动手动脑二
    随机数一、JOptionPane:主要用到四种消息提示框方法:showConfirmDialog():确认对话框showInputDialog():输入对话框showMessageDialog():消息对话框showOptionDialog():选择对话框 主要有五种消息类型,类型不同,图标不同:•ERROR_MESSAGE•INFORMATION_MESSAGE•WARNING_MESS......
  • JavaScript数组filter方法
    1.数组filter方法作用筛选数组,将满足条件的元素放入新数组中2.语法:array.filter(function(item,index,arr){})第一个参数:item,必须,当前元素的值第二个参数:index,可选,当前元素在数组中的索引值第三个参数:arr,当前元素所处的数组对象3.filter方法特点(1)函......
  • JAVA——两个List集合求交集、并集和差集(去重)
    https://juejin.cn/post/6899000526613151752@TestpublicvoidsplitGetPositionOne2()throwsException{List<String>stringList=newArrayList<>();stringList.add("a");stringList.add("b");stringList.add(&......
  • javascript处理数组
     letdata=[{"subject_id":948,"xmdw":"长春市实验中学","sbnd":2023,"xmmc":"长春市实验中学食堂厨具设备更换项目"},{"subject_id":949,"x......
  • java相关配置讲解
    1spring:2application:3name:app-service-qms#指定服务名称4profiles:5active:sit#指定本次启动服务运行环境67server:8port:200019ws:10endpoint:9999/MsgTrackSrvPortType/R13402003193?wsdl1112cron:......
  • 无涯教程-JavaScript - BETA.DIST函数
    描述BETA.DIST函数返回beta分布。Beta分布通常用于研究样品中某物百分比的变化。语法BETA.DIST(x,alpha,beta,cumulative,[A],[B])争论Argument描述Required/OptionalXThevaluebetweenAandBatwhichtoevaluatethefunction.RequiredAlphaAparameterof......
  • Java学习之路--GUI编程01
    packagecom.gui.lesson01;importjava.awt.*;importjava.awt.event.WindowAdapter;importjava.awt.event.WindowEvent;//GUI编程课堂练习exercise--练习2023.3.14publicclassExerciseDemo{publicstaticvoidmain(String[]args){//总的Frame窗口F......
  • Java学习之路--网络编程相关01
    packagecom.kuang.lesson01;importjava.net.InetAddress;importjava.net.UnknownHostException;//2023.2.28/3.1Java狂神说-网络编程实战-IP地址publicclassTestnetAddress{publicstaticvoidmain(String[]args){//测试iptry{//查询......