首页 > 其他分享 >使用百度云内容审核

使用百度云内容审核

时间:2023-08-09 11:14:04浏览次数:39  
标签:conclusionType return String 内容 error 审核 type 百度

截止2023年8月10号,使用百度云的内容审核只需要身份认证即可,且可领取免费的测试资源。

领取资源

百度云的内容审核各服务均提供一定额度的免费测试资源供测试使用,免费测试资源使用完毕后,可选择付费使用。

各接口免费测试资源可见免费测试资源文档介绍。

进入领取页面,根据情况选择领取接口,左下角0元领取

个人认证:

内容审核平台-文本:一次性赠送50,000次,2 QPS,有效期 365天;

内容审核平台-图像:一次性赠送10,000次,2 QPS,有效期 365天。

创建应用列表

调用百度AI服务需要Access_token,获取Access_token则需要通过应用的 API Key和 Secret Key,我们需要创建一个应用

创建完成之后,我们就得到了 API Key 和 Secret Key

获取AccessToken

鉴权认证的主要目的是获取Access_token。Access_token是用户的访问令牌,承载了用户的身份、权限等信息。

使用我提供的工具类获取:

依赖:

<dependency>
    <groupId>com.squareup.okhttp3</groupId>
    <artifactId>okhttp</artifactId>
</dependency>
<dependency>
    <groupId>com.alibaba</groupId>
    <artifactId>fastjson</artifactId>
</dependency>
/**
 * 百度云鉴权认证工具
 */
public class AuthUtil {

    private static Calendar expireDate;
    private static boolean flag = false;
    private static String accessToken;

    static final OkHttpClient HTTP_CLIENT = new OkHttpClient().newBuilder().build();

    private static Boolean needAuth() {
        Calendar c = Calendar.getInstance();
        c.add(Calendar.DATE, 1);
        return !flag || c.after(expireDate);
    }

    /**
     * 获取权限token
     * @return access_token
     */
    public static String getAccessToken(String clientId, String clientSecret) throws Exception {
        if (needAuth()) {
            flag = true;
            JSONObject auth = getAuth(clientId, clientSecret);
            accessToken = auth.getString("access_token");
            expireDate = Calendar.getInstance();
            expireDate.add(Calendar.SECOND, auth.getIntValue("expires_in"));
        }
        return accessToken;
    }

    /**
     * 从用户的AK,SK生成鉴权签名(Access Token)
     *
     * @return 鉴权签名(Access Token)
     * @throws IOException IO异常
     */
    private static JSONObject getAuth(String clientId, String clientSecret) throws Exception {
        MediaType mediaType = MediaType.parse("application/json");
        RequestBody body = RequestBody.create(mediaType, "");
        Request request = new Request.Builder()
                .url(String.format(URLConstants.BAIDU_AUTH_TOKEN, clientId, clientSecret))
                .method("POST", body)
                .addHeader("Content-Type", "application/json")
                .addHeader("Accept", "application/json")
                .build();
        Response response = HTTP_CLIENT.newCall(request).execute();
        if (response.code() != HttpStatus.OK.value()) {
            throw new RuntimeException("百度云AccessToken获取失败");
        }
        return JSONObject.parseObject(response.body().string());
    }
}

内容审核服务

内容审核平台-文本
接口地址:https://aip.baidubce.com/rest/2.0/solution/v1/text_censor/v2/user_defined
请求方式:POST
接口名称:内容审核平台-文本

内容审核平台-图像
接口地址:https://aip.baidubce.com/rest/2.0/solution/v1/img_censor/v2/user_defined
请求方式:POST
接口名称:内容审核平台-图像

返回参数说明:

参数名称 数据类型 是否必须 备注
log_id Long Y 请求唯一id
error_code Long N 错误提示码,失败才返回,成功不返回
error_msg String N 错误提示信息,失败才返回,成功不返回
conclusion String N 审核结果,可取值:合规、不合规、疑似、审核失败
conclusionType Integer N 审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败

成功响应案例

{
	"log_id": 15556561295920002,
	"conclusion": "合规",
	"conclusionType": 1
}

失败响应示例

{
    "log_id": 149319909347709, 
    "error_code": 0,
    "error_msg":"configId error"
}

代码实现

依赖:

<dependency>
    <groupId>org.projectlombok</groupId>
    <artifactId>lombok</artifactId>
</dependency>
@Getter
@Setter
@Slf4j
@Component
@ConfigurationProperties(prefix = "baiduyun")
public class ContentCensor {

    private String clientId;
    private String clientSecret;

    /**
     * 文本审核
     *
     * @param text 待审核文本
     * @return 审核结果 { log_id, conclusion, conclusionType }
     * @throws Exception 审核异常
     */
    public Map<String, Object> textCensor(String text) throws Exception {

        String accessToken = AuthUtil.getAccessToken(clientId, clientSecret);
        FormBody formBody = new FormBody.Builder().add("text", text).build();
        Request request = new Request.Builder()
                .url(String.format(URLConstants.BAIDU_TEXT_CENSOR, accessToken))
                .method("POST", formBody)
                .addHeader("Content-Type", "application/x-www-form-urlencoded")
                .addHeader("Accept", "application/json")
                .build();

        Response response = AuthUtil.HTTP_CLIENT.newCall(request).execute();
        String strBody = response.body().string();
        if (response.code() != HttpStatus.OK.value()) {
            JSONObject errObj = JSONObject.parseObject(strBody);
            log.error("百度文本审核接口调用失败:error_code: {}, error_msg: {}", errObj.getString("error_code"), errObj.getString("error_msg"));
            throw new RuntimeException("百度文本审核接口调用失败");
        }

        JSONObject resultObj = JSONObject.parseObject(strBody);
        Map<String, Object> result = new HashMap<>();
        result.put("log_id", resultObj.getString("log_id"));
        result.put("conclusion", resultObj.getString("conclusion"));
        result.put("conclusionType", resultObj.getShortValue("conclusionType"));
        return result;
    }

    /**
     * 图像审核
     *
     * @param imgParams 待审核图像列表 Base64字符串列表
     * @return 审核结果 { log_id, conclusion, conclusionType }
     * @throws Exception 审核异常
     */
    public Map<String, Object> imgCensor(List<String> imgParams) throws Exception {

        String accessToken = AuthUtil.getAccessToken(clientId, clientSecret);
        Request.Builder builder = new Request.Builder()
                .url(String.format(URLConstants.BAIDU_IMG_CENSOR, accessToken))
                .addHeader("Content-Type", "application/x-www-form-urlencoded")
                .addHeader("Accept", "application/json");

        Map<String, Object> result = new HashMap<>();
        for (String imgParam : imgParams) {
            FormBody formBody = new FormBody.Builder().add("image", imgParam).build();
            Request request = builder.method("POST", formBody).build();
            Response response = AuthUtil.HTTP_CLIENT.newCall(request).execute();
            String strBody = response.body().string();
            if (response.code() != HttpStatus.OK.value()) {
                JSONObject errObj = JSONObject.parseObject(strBody);
                log.error("百度图像审核接口调用失败:error_code: {}, error_msg: {}", errObj.getString("error_code"), errObj.getString("error_msg"));
                throw new RuntimeException("百度文本审核接口调用失败");
            }
            JSONObject resultObj = JSONObject.parseObject(strBody);
            Short conclusionType = resultObj.getShort("conclusionType");
            // 审核不是通过
            if (!Objects.equals(conclusionType, TextCensorResultEnum.COMPLIANCE.type())) {
                result.put("log_id", resultObj.getString("log_id"));
                result.put("conclusion", resultObj.getString("conclusion"));
                result.put("conclusionType", resultObj.getShortValue("conclusionType"));
                return result;
            }
        }
        result.put("conclusionType", TextCensorResultEnum.COMPLIANCE.type());
        return result;
    }
}

常量的定义如下:

public class URLConstants {

    public static final String BAIDU_AUTH_TOKEN = "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s";
    public static final String BAIDU_TEXT_CENSOR = "https://aip.baidubce.com/rest/2.0/solution/v1/text_censor/v2/user_defined?access_token=%s";
    public static final String BAIDU_IMG_CENSOR = "https://aip.baidubce.com/rest/2.0/solution/v1/img_censor/v2/user_defined?access_token=%s";
}

枚举类的定义如下:

public enum TextCensorResultEnum {

    COMPLIANCE((short) 1, "合规"),
    NON_COMPLIANCE((short) 2, "不合规"),
    SUSPECTED((short) 3, "疑似"),
    AUDIT_FAILED((short) 4, "审核失败");

    private final Short type;
    private final String desc;

    TextCensorResultEnum(Short type, String desc) {
        this.type = type;
        this.desc = desc;
    }

    public Short type() {
        return type;
    }

    public String desc() {
        return desc;
    }
}

自动装配

如果代码放在其他模块中,请使用该部分实现自动装配

resources目录下创建META-INF/spring.factories,内容如下:

org.springframework.boot.autoconfigure.EnableAutoConfiguration=\
  com.swx.common.baiduyun.ContentCensor

项目集成

以上内容可以放在工具模块或者公共模块中,在服务模块中食用方式如下:

引入依赖(非服务模块):

<dependency>
    <groupId>com.swx</groupId>
    <artifactId>test-common</artifactId>
</dependency>

配置文件

baiduyun:
  client-id: xxxxxxxxxxxxxxxxxxxx
  client-secret: xxxxxxxxxxxxxxxxxxxxxxx
  • 填入上述步骤获取的 API Key(client-id) 和 Secret Key(client-secret)

使用文本审核

/**
 * 审核文本内容
 *
 * @param text   文本内容
 * @return 是否审核通过
 */
private boolean handleTextScan(String text) {
    try {
        Map<String, Object> map = contentCensor.textCensor(text);
        Short type = (Short) map.get("conclusionType");
        if (type.equals(TextCensorResultEnum.NON_COMPLIANCE.type())) {
            // 当前文本中存在违规内容
        }
        if (type.equals(TextCensorResultEnum.SUSPECTED.type())) {
            // 当前文本中存在不确定性内容
        }

        if (type.equals(TextCensorResultEnum.AUDIT_FAILED.type())) {
            // 自动审核失败,转人工审核
        }

        return type.equals(TextCensorResultEnum.COMPLIANCE.type());
    } catch (Exception e) {
        e.printStackTrace();
        return false;
    }
}

使用图像审核

关于接口需要数据有两种格式:

  • Base64字符串,需要编码之后的(本文使用)
  • 图片URL地址
/**
 * 审核图片内容
 *
 * @param images 图片地址列表
 * @return 是否审核通过
 */
private boolean handleImageScan(List<String> images) {
    List<String> imgParams = new ArrayList<>();
    // 图片去重
    images = images.stream().distinct().collect(Collectors.toList());
    for (String image : images) {
        // 下载图片,从url中获取为字节数据
        byte[] imgData = downLoadFile(image);
        // 转为Base64,百度云接口要求
        String imgStr = Base64Util.encode(imgData);
        String imgParam = URLEncoder.encode(imgStr, StandardCharsets.UTF_8);
        imgParams.add(imgParam);
    }

    try {
        Map<String, Object> map = contentCensor.imgCensor(imgParams);
        Short type = (Short) map.get("conclusionType");
        
        if (type.equals(TextCensorResultEnum.NON_COMPLIANCE.type())) {
            // 存在违规内容
        }
        if (type.equals(TextCensorResultEnum.SUSPECTED.type())) {
            // 图片疑似有违规内容
        }
        if (type.equals(TextCensorResultEnum.AUDIT_FAILED.type())) {
            // 自动审核失败,转人工审核
        }
        return type.equals(TextCensorResultEnum.COMPLIANCE.type());
    } catch (Exception e) {
        e.printStackTrace();
        return false;
    }
}

自维护敏感词汇

可以使用DFA算法,使用确定有穷自动计机(一种数据结构)。

标签:conclusionType,return,String,内容,error,审核,type,百度
From: https://www.cnblogs.com/sw-code/p/17616287.html

相关文章

  • 遇到的问题-----网上下载的项目修改代码无效,不能相应的生成相应的页面内容
    最近帮同学改毕业设计  同学在网上下了很多  项目的构造方式真是五花八门  昨天改一个项目的时候竟然遇到很奇葩的情况,我在后台.cs改代码, 打点(.)之后没有相应的变量跳出来供你选择 而且修改.cs中的代码运行后根本没有变化 就算是你写错误的代码照样能......
  • c#调用百度地图web服务api-----该方法可用在js跨域请求上
    百度地图Web服务API为开发者提供http接口,即开发者通过http形式发起检索请求,获取返回json或xml格式的检索数据。用户可以基于此开发JavaScript、C#、C++、Java等语言的地图应用。api官网说明链接:http://developer.baidu.com/map/webservice.htm可用接口列举:获取相关地址提示place......
  • java调用百度地图web服务api-----该方法可用在js跨域请求上
    百度地图Web服务API为开发者提供http接口,即开发者通过http形式发起检索请求,获取返回json或xml格式的检索数据。用户可以基于此开发JavaScript、C#、C++、Java等语言的地图应用。api官网说明链接:http://developer.baidu.com/map/webservice.htm可用接口列举:获取相关地址提示place......
  • 百度地图api接口poi检索示例----并在信息框显示经纬度
    api官网http://developer.baidu.com/map/jshome.htm例子代码(保存为静态页面html可见效果如下):<html><head><metahttp-equiv="Content-Type"content="text/html;charset=utf-8"/><metaname="viewport"content="initial-scale=......
  • 利用 iframe将其他网站 某一个部分的内容 嵌入到 自己的网站中
    [利用iframe将其他网站某一个部分的内容嵌入到自己的网站中_iframe嵌入网页的一部分_奔跑的长毛象的博客-CSDN博客](https://blog.csdn.net/weixin_42654817/article/details/83141889) ```h5<!DOCTYPEhtml><html><head>   <title>HelloWorld</title>   <st......
  • 2023年百度之星程序设计竞赛初赛1题解
    每次出题都出其不意---->群友蓝桥国三ac一道题根据官方的视频题解整理依据难度的划分第五题:促销糖果 分析:从答案出发想吃K个糖果,必定有k个糖纸,考虑换购,则有一张糖纸是不可以换的(因为你必须至少要买一颗糖果)则换购的数量为(k-1)/减去换购的糖果则是买的糖果packageLi2209;i......
  • 在线帮助中心两大必备要素:搜索功能、内容支持,帮助中心设计指导
    对于用户而言,在线帮助中心是一个丰富的使用手册,包括产品功能模块介绍、入门和使用,以及常见问题等,可以帮助用户麻溜地上手一个工具,并在遇到问题时可以查询获取解决方案。在线帮助中心当前关于在线帮助中心建设主要是通过自助建站和在线帮助中心搭建工具两种方式进行,但是传统的自助建......
  • 在搭建帮助中心系统的时候可不要漏掉这些内容
    帮助中心系统这个概念虽然已经是出现了很久的,但是looklook发现还是有很多网友对其具体内容不太了解。今天looklook就来盘点一下,如果想要搭建一个帮助中心系统,我们最好在里面添加哪些内容呢!帮助中心系统应包含的内容1.常见问题解答(FAQ):列出用户经常遇到的问题并提供简明的解答,帮助用......
  • kettle案例一抽取gz格式文本内容保存到mongodb
    版本和启动我们这里使用的7.1版本,官网下载的安装包为pdi-ce-7.1.0.0-12.zip。安装目录下非常多的执行程序,但没有明显的启动图标。Kettle常用三大家族:Spoon、Pan、Kitchen。Spoon:通过图形界面方式设计、运行、调试Job与Transformation。Pan:通过脚本命令方式来运行Transform......
  • python 使用BeautifulSoup的 html5lib爬取网站内容
    1、使用BeautifulSoup的'html5lib'能像网页工具一样渲染内容。缺点:运行比较慢2、安装包pipinstallhtml5lib3、直接获取网页的所有有效内容importrequests#数据请求模块第三方模块pipinstallrequestsfrombs4importBeautifulSoupheads={'User-Agen......