首页 > 其他分享 >GPT生成过程中的Top_p和Top_k

GPT生成过程中的Top_p和Top_k

时间:2023-09-30 14:11:07浏览次数:29  
标签:问题 Top 生成 tokens GPT top

一、背景

GPT生成的代码中,往往有很多需要设置的参数,例如top_p、top_k等。下面介绍一下这些参数意义和提出的原因。

二、Top_K

top_k是一个经典的方法,表示从候选的K个值中选择一个。在GPT生成的过程中也是类似的问题。选取K个tokens,哪些tokens的概率最高。然而Top_K存在一些问题,就是对于开放的问题,回答不够好,随机性不够强。因此提出了Top_P的算法。

三、Top_P

top_p算法表示,满足概率之和大于p的最小tokens集合。这样在下一个词不确定的情况下,可以采样更多的词,在下一个词确定的情况下,可以减少模型的幻觉的问题(采样的词更少)。

四、总结

对于不同的方法,针对的场景不同,在需要开放性问题回答的时候,采取Top_P的方法,增加一下随机性,在确定性的问题时,采取Top_K的方法。实际过程中,Top_P和Top_K可以同时使用,并且像beam搜索和greedy的方法也可以交替使用。但是需要考虑实际的场景,避免模型幻觉问题。

五、参考

huggingface的博客

标签:问题,Top,生成,tokens,GPT,top
From: https://www.cnblogs.com/future-dream/p/17737791.html

相关文章

  • 怎么根据excel里面的内容和邮箱地址,生成pdf,并发送给对应邮箱
    Craftedby[Genie](https://marketplace.visualstudio.com/items?itemName=genieai.chatgpt-vscode)You怎么根据excel里面的内容和邮箱地址,生成pdf,并发送给对应邮箱Genie要根据Excel文件中的内容和邮箱地址生成PDF并发送到相应的邮箱,你可以使用Python编程语言来完成这个任......
  • python生成词云图
    importwordcloudimportmatplotlib.pyplotaspltfromimageioimportimreadprint([1,2]+[3,4])#创建一个词云对象wc=wordcloud.WordCloud()img=imread(r'F:\PyCharm\test\bg.jpg')#要生成词云的文本text='''Whycanpre-trainedlanguagem......
  • 【中秋国庆不断更】XML在HarmonyOS中的生成,解析与转换(上)
    一、XML概述XML(可扩展标记语言)是一种用于描述数据的标记语言,旨在提供一种通用的方式来传输和存储数据,特别是Web应用程序中经常使用的数据。XML并不预定义标记。因此,XML更加灵活,并且可以适用于广泛的应用领域。XML文档由元素(element)、属性(attribute)和内容(content)组成。​......
  • this.getOptions is not a function at Object.loader
    问题描述VuePress使用有样式的组件时报错this.getOptionsisnotafunctionatObject.loader原因分析是这个导致的<stylelang="scss">你的依赖反应不了它就会报错解决方案需要安装sass-loaderstyle-loadersass-loader版本不能太高。。。安装@7的成功运行......
  • 零代码编程:用ChatGPT批量修改文件夹名称中的大小写
    一个文件夹下面有很多个子文件夹,要把文件夹中的大写数字全部重命名为小写数字,比如将二三四,改成:234在ChatGPT中输入提示词如下:你是一个Python编程专家,要完成一个文件夹重命名的任务。具体步骤如下:本地电脑“E:\PeppaPig小猪佩奇”文件夹下有很多个文件夹;获取所有文件夹标题名......
  • 零代码编程:用ChatGPT批量将多个文件夹中的视频转为音频
    有多个文件夹中的视频,都要批量转换成音频格式。转换完成后要删除视频。虽然现在已经有很多格式转换软件可以实现这个功能,但是需要一个个文件夹的操作,还要手动去删除视频。用ChatGPT来写一个批量自动操作程序吧:输入提示词如下:你是一个Python编程专家,要完成一个批量转换格式的任务,具......
  • STM32CubeMX 生成的 Makefile 文件解析
    STM32CubeMX生成的Makefile文件解析Makefile的前置知识一个makefile是由一系列的规则(rule)组成的。一条完整的规则包括目标(target)、依赖(prerequistites)、方法(recipe):target...:prerequistites...recipe......依赖和方法不一定需要同......
  • 结对项目:自动生成小学四则运算题目
    用Python实现一个自动生成小学四则运算题目的命令行程序 软件工程计科21级12班(广东工业大学-计算机学院)作业要求结对项目作业目标熟悉结对编程 成员姓名班级学号黄翼山计算机科学与技术2021级2班3119004783扎恩哈尔·吾兰计算机科学......
  • 结对项目:用Python实现自动生成小学四则运算题目的程序
    Python实现四则运算程序软件工程计科21级1.2班作业要求https://edu.cnblogs.com/campus/gdgy/CSGrade21-12/homework/13016作业目标完成结对项目:四则运算;熟悉团队协作的方法和模式github链接:https://github.com/howdnb/howdnb项目成员信息姓名学号......
  • 结对项目:实现一个自动生成小学四则运算题目的命令行程序
    1作业摘要与结对伙伴介绍1.1作业摘要这个作业属于哪个课程所属课程链接这个作业要求在哪里作业要求链接这个作业的目标<熟悉软件工程流程,把握PSP流程框架,精进测试代码和性能改进的能力>Github链接1.2结对伙伴信息姓名学号彭学智3121004878......