首页 > 其他分享 >月工资不到10元的内容审核专员? - ChatGPT 在内容自动审查中的应用

月工资不到10元的内容审核专员? - ChatGPT 在内容自动审查中的应用

时间:2023-08-01 16:15:06浏览次数:40  
标签:10 const 月工资 内容 Azure 审核 ChatGPT 文本

内容过滤筛查是指对网络上发布或传播的文本、图片、视频等内容进行审核和监管,以防止出现违法违规、暴力色情、虚假广告、电信诈骗等现象,维护网络安全和社会秩序。

内容过滤筛查是一个亟待解决的问题,因为网络内容的数量庞大,且具有多样性、动态性和隐晦性。对于处理用户数据的软件或者网站的开发者来说,内容审核必不可少,通过内容过滤筛查可以有效阻止一些恶意用户。

 

传统内容审核一般需要人工参与结合规则或关键词,通过预设一些条件或标准来判断内容是否合规。然而,这种方法存在很多局限性和缺陷:

  • 人工审核成本高昂,一般个人或者小型工作室难以负担
  • 人工审核难以处理大量数据,很难做到实时检测
  • 规则或关键词难以覆盖所有情况,容易漏掉一些隐晦或变化的不良内容
  • 规则或关键词容易被规避或绕过,容易出现误报或漏报。
  • 规则或关键词需要不断更新和维护,耗费人力和时间。

因此,我们需要一种更智能和灵活的方法来提高内容过滤筛查的效率和准确性。ChatGPT作为一种先进的自然语言生成的AI技术,可以为内容过滤筛查提供一种新的解决方案。

本文主要讨论利用Azure OpenAI的ChatGPT对文本内容筛查。相比于使用OpenAI, Azure OpenAI有以下优点:

  • 两者底层的模型都是一样的,使用起来几乎没有区别
  • 没有屏蔽国内用户,可以在国内直接调用
  • 有现成的Azure SDK可以使用,不必裸写HTTP请求
  • 可以上传自己的数据集,对模型进行fine-tuning(微调)

使用Azure OpenAI的ChatGPT做内容过滤筛查的大致流程如下:

  • 在Azure门户上创建一个Azure OpenAI资源,并部署ChatGPT模型。我们可以选择不同的部署名称和规格,以满足不同的需求和预算。
  • 使用Azure OpenAI SDK或REST API来调用ChatGPT模型,并传入网络内容作为输入。我们可以选择不同的输入格式和参数,以控制模型的行为和输出。
  • 接收并处理ChatGPT模型返回的输出,并根据需要对网络内容进行过滤筛查。我们可以选择不同的输出格式和处理方式,以实现不同的目标和效果。

下面是一个简单NodeJs的Web API示例代码,可以对发送过来的文本进行自动审核:

const openai = require("@azure/openai");
const express = require("express");
const app = express();
// 设置必要的参数
const endpoint = "<Azure OpenAI的URL>";
const key = "<Azure OpenAI资源的密钥>";
const engine = "chatgpt"; // 部署名称
// 创建一个OpenAI客户端
const client = new openai.OpenAIClient(endpoint, key);
// 定义一个中间件,用于解析请求体中的JSON数据
app.use(express.json());
// 定义一个路由,用于接收POST请求,传入一段文本,返回是否为不良内容和替代文本
app.post("/validate", async (req, res) => {
  // 获取请求体中的文本
  const text = req.body.text;
  // 使用Azure OpenAI ChatGPT作为一个分类器,输入一段文本,输出其是否为不良内容, 可以根据自己的需求,调整下面的内容
  const response1 = await client.chatCompletion(engine, [
    { role: "system", content: "请根据发送过来的文本,判断其是否包含不良内容. 如果有就返回bad, 如果没有返回good" },
    { role: "user", content: text },
  ]);
  const label = response1.choices[0].message.content;
  // 返回响应体
  res.json({
    isBad: label === "bad",
  });
});
app.listen(3000, () => {
  console.log("App is running on port 3000");
});

 

把上述代码部署到http服务器后,要调用这个REST API,使用任何支持HTTP请求的语言或工具。例如,可以使用Python的requests库来发送一个POST请求,传入一段文本,获取返回的结果。以下是一个可能的示例代码:

import requests
url = "http://localhost:3000/validate" # REST API的地址,根据实际情况修改
text = "这是一段测试文本,没有什么不良内容。" # 要审核的文本
response = requests.post(url, json={"text": text})
result = response.json()
print(result)

 

上述代码仅是一个简单的示例,在实际使用过程中,还需要考虑很多内容,包括错误处理,数据加密,模型微调和设置更好的prompt等。当然,AI也不是万能的,肯定会存在误判或者漏判的情况,一般可以考虑和人工审核相结合,使用AI进行初步判断筛选,对于疑似的内容进行人工二次审核,可以极大地减轻审核人员的负担。

目前,这边大部分处理用户内容的软件都已经接入了AI自动审核系统,审核数千条的内容的成本只有几十美分,成本十分低廉,效果也达到了令人满意的程度。通过AI自动审批初步筛选判断,人工审核为辅的方式极大减轻了人工审核的负担,并可以有效检测到一些隐晦或变化的不良内容,有力地打击了一些恶意用户。

 

标签:10,const,月工资,内容,Azure,审核,ChatGPT,文本
From: https://www.cnblogs.com/reachteam/p/17596775.html

相关文章

  • day10
    面向对象程序设计1940年以前:面向机器——二进制码、汇编面向过程——COBOL、FORTRAN、BASIC、C语言等结构化程序设计——抛弃goto语句,采取“自顶向下、逐步细化、模块化”的指导思想。结构化程序设计本质上还是一种面向过程的设计思想,但通过“自顶向下、逐步细化、模块......
  • Python-10-Python常见高级用法
    10-1Lambda匿名函数匿名函数:没有定义函数的名称,可以实现函数某些简单的功能。格式:lambdaparam_list:expression#param_list参数列表#expression简单表达式,没法实现复杂的代码块内容需求1:传入xy,返回x+y例子:f=lambdax,y:x+yf(3,4)#7lambda与向量表达式......
  • Spring Cloud Alibaba 2022 正式发布,启动速度提升 10 倍,各方面直接起飞!
    大家好,我是栈长。经过SpringCloudAlibaba2022的第一个候选版本2022.0.0.0-RC1发布7个多月后,中间还有一个2022.0.0.0-RC2版本,就在前几天,SpringCloudAlibaba2022.0.0.0正式版终于正式发布了。SpringCloudAlibaba2022.0.0.0依赖更新由于SpringBoot各个版本......
  • win10最新版apktool 反编译
    apktool_2.6.0.jar 改成apktool.jar和apktool.bat放在同一个文件夹,并将此文件夹加入系统变量Path(D:\SoftWare\apktool)apktool.bat:@echooffsetlocalsetBASENAME=apktool_chcp650012>nul>nulsetjava_exe=java.exeifdefinedJAVA_HOME(setjava_exe="%JAVA_HOME%\b......
  • 英语背单词 专四词汇 2023年08月 ChatGPT
    2023-08-01Explainthemeaningofthefollowingwordsalongwithindexandphoneticsymbol:viewfinder,townsfolk,steering-wheel,hairspray,troubleshooter, opener,treasure-house,spiced,tumour,shortsighted,reassessment,histogram,deliindexwordp......
  • ChatGPT在热门行业的应用场景有哪些
    chatgpt,一个火出圈的“聊天机器人”。从写作文,到写代码,似乎没有什么是它干不了的。ChatGpt在工业中的应用场景有哪些?在工业领域,它可以用于提高生产效率,缩短生产周期,并帮助工人解决生产过程中的问题。例如,在一个工厂的生产线上,工人可以使用ChatGpt来获得快速的生产指导......
  • Gym104128L Proposition Composition
    很好口胡却不好写。把边分成链边和额外边首先想到分类讨论,显然不能只删额外边,所以有两类情况,删一链边和两链边。如果删一链边,这一链边要么完全没被额外边覆盖,然后其他任选一条;要么被覆盖一次,额外边选覆盖它的边。用线段树简单维护即可。现在难的是删两链边,且这两条链边都至少......
  • 智能客服助理:ChatGPT+私有数据=智能知识库+个性化AI
    “喊得凶,落地少”ChatGPT到底如何落地TOB行业?不少小伙伴都比较迷惑因为几乎没看到几个靠谱的案例但是,很多企业已经扛着“锄头”开始整活了比如唯一客服推出了智能客服助理可基于ChatGPT和私有数据构建智能知识库和个性化AI支持私有化部署文档数据本地化,安全可控 ......
  • 10-面向对象
    1.类与对象Java是一门纯面向对象的语言(ObjectOrientedProgram,简称OOP),在面向对象的世界里,一切皆为对象。一个程序就是一个世界,有很多事物(对象[属性,行为])什么是面向对象?什么是面向过程?面向对象:面向对象是解决问题的一种思想,主要依靠对象之间的交互完成一件事情。面向过程......
  • 2010新的开始
          1)养成习惯,经常主动回顾一段时间学到的东西(这不仅有利于巩固长时记忆,而且一段时间之后的回顾你可能已经因为新的知识学习从而对原先的认识有了进一步的看法,通过回顾,可以整合新旧知识,得到新的启发。2)创造回忆的机会:我知道第一条不顶用,没有人(好吧,很少有人)能够真正坚......