DetectGPT:使用概率曲率的零样本机器生成文本检测

时间：2023-03-06 10:46:44浏览次数：61

DetectGPT的目的是确定一段文本是否由特定的llm生成，例如GPT-3。为了对段落 x 进行分类，DetectGPT 首先使用通用的预训练模型（例如 T5）对段落 ~~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~~xi进行比较。如果平均对数比高，则样本可能来自源模型。

ChatGPT是一个热门话题。人们正在讨论是否可以检测到一篇文章是由大型语言模型(LLM)生成的。DetectGPT定义了一种新的基于曲率的准则，用于判断是否从给定的LLM生成。DetectGPT不需要训练单独的分类器，不需要收集真实或生成的段落的数据集，也不需要显式地为生成的文本加水印。它只使用由感兴趣的模型计算的对数概率和来自另一个通用预训练语言模型(例如T5)的文章随机扰动。

完整文章：

https://avoid.overfit.cn/post/32ade57f49d14bbca4899fcc1a672146

标签：DetectGPT,模型,样本,生成,曲率,文本
From： https://www.cnblogs.com/deephub/p/17182881.html

TextView(文本框)详解
从本节开始我们来一个个讲解Android中的UI控件，本节给大家带来的UI控件是：TextView(文本框)，用于显示文本的一个控件，另外声明一点，我不是翻译API文档，不会一个个属性的去扣，只学实......
统计文本文件的最长子串的长度
publicclasstest_a{publicstaticvoidmain(String[]args)throwsIOException{Stringpath="F:/piao.txt";FileInputStreamfis=new......
计算英语文本中首尾接龙最长数量
publicclassTest1{publicstaticvoidmain(String[]args)throwsIOException{//TODO自动生成的方法存根Stringfilename="E:\\123......
初探富文本之CRDT协同实例
初探富文本之CRDT协同实例在前边初探富文本之CRDT协同算法一文中我们探讨了为什么需要协同、分布式的最终一致性理论、偏序集与半格的概念、为什么需要有偏序关系、如何通......
VSCode 复制匹配到的文本
查找到指定格式的内容之后。点击菜单栏选择、选择所有匹配项。参考：使用VSCode提取指定特征的文本......
文本数据清洗：去除纯数字、纯字母、手机号等
importpandasaspdimportre#获取所有句子，并且没有重复值df1=pd.read_csv("无标题.csv",encoding='gbk')col1=df1[["usermsg"]]df2=pd.read_csv("无标题.c......
1.基于Label studio的训练数据标注指南：信息抽取（实体关系抽取）、文本分类等
文本抽取任务LabelStudio使用指南1.基于Labelstudio的训练数据标注指南：信息抽取（实体关系抽取）、文本分类等2.基于Labelstudio的训练数据标注指南：（智能文档）文档抽取任务......
适用于 .NET 的开源文本差异对比组件
适用于.NET的开源文本差异对比组件DotNet大王源码资料,微信zhaoxi965,有问必复关注他 1人赞同了该文章对于开发人员来说，Git是我们经常使用......
sap -文本编辑器
DATA:ok_codeTYPEsy-ucomm,save_okTYPEsy-ucomm.DATA:init.DATA:containerTYPEREFTOcl_gui_custom_container.DATA:editorTYPEREFTOcl_gui_texted......
3.基于Label studio的训练数据标注指南：文本分类任务
文本分类任务LabelStudio使用指南1.基于Labelstudio的训练数据标注指南：信息抽取（实体关系抽取）、文本分类等2.基于Labelstudio的训练数据标注指南：（智能文档）文档抽取任务......

DetectGPT:使用概率曲率的零样本机器生成文本检测

相关文章

赞助商

阅读排行