首页 > 其他分享 >大模型中的tempture以及top-p问题

大模型中的tempture以及top-p问题

时间:2024-07-14 21:51:42浏览次数:11  
标签:采样 输出 概率 top tempture 模型 温度

原文:https://blog.csdn.net/jarodyv/article/details/128994176

参考:https://blog.csdn.net/engchina/article/details/138258047

为了使大模型的生成和表达更加多样,GPT采用了tempture以及top-p方法。当然还有限制大模型字数的方法(max_tokens = 50 )。

GPT的输出层后面一般跟着softmax,在判别式模型中我们会输出概率最高的那一类别。

 这样的贪心策略会使得模型的输出相对固定,生成内容很死板。因此提出了此两种方法。

top_p采样

chatgpt采用一种top-p方法来进行采样,解决该问题。简而言之,就是对结果从高到低排序,按累积概率p截尾去掉概率小的分布,最后筛选得到几个概率较高的结果,归一化后按分布抽样。

温度采样

温度采样受统计热力学的启发,高温意味着更可能遇到低能态。在概率模型中,logits 扮演着能量的角色,我们可以通过将 logits 除以温度来实现温度采样,然后将其输入 Softmax 并获得采样概率。
越低的温度使模型对其首选越有信心,而高于 1 的温度会降低信心。0 温度相当于 argmax 似然,而无限温度相当于于均匀采样。
温度采样中的温度与玻尔兹曼分布有关,其公式如下所示:

该式就是softmax的变体,T值越大时,结果越呈现一种均匀分布。

 此外还有频率惩罚(frquency_penalty)、存在惩罚(presence_penalty),使大模型有更大的概率输出从未使用的词语,去除重复的输出或提示。

最后,还有likehood,生成新词时,会为每一个词赋likehood值,某词的likehood值越高,则越有可能在下一轮输出某词。



标签:采样,输出,概率,top,tempture,模型,温度
From: https://www.cnblogs.com/xmds/p/18302077

相关文章

  • 常曲率空间的扭积模型
    定理2.2.1设\(Q^n_\lambda\)表示常曲率为\(\lambda\)的单连通空间形式,且\(p\)是\(Q^n_\lambda\)中的一个点。那么当\(\lambda\leq0\)时,\(Q^n_\lambda\setminus\{p\}=(0,\infty)\times_{s^2_\lambda}S^{n-1}(1)\);当\(\lambda>0\)时,\(Q^n_\lam......
  • 模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 -Plugin
                          ......
  • MEGALODON:突破传统,实现高效无限上下文长度的大规模语言模型预训练和推理
    在人工智能领域,尤其是在自然语言处理(NLP)中,大模型(LLMs)的预训练和推理效率一直是研究的热点。最近,一项突破性的研究提出了一种新型神经网络架构——MEGALODON,旨在解决传统Transformer架构在处理长序列时面临的挑战。MEGALODON-7B、LLAMA2-7B和LLAMA2-13B在训练过程中处理......
  • 模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 - 5种工具
                                          ......
  • 关于Kafka Topic分区和Replication分配的策略
    文章目录1.Topic多分区2.理想的策略3.实际的策略4.如何自定义策略1.Topic多分区如图,是一个多分区Topic在Kafka集群中可能得分配情况。P0-RL代表分区0,Leader副本。这个Topic是3分区2副本的配置。分区尽量均匀分在不同的Broker上,分区的Follower副本尽量不和Lea......
  • STAThread与Windows UI线程模型
    STAThread与WindowsUI线程模型1.STAThread属性标注Main方法,使主线程运行在STA模式。用于兼容需要STA环境的COM组件,特别是UI组件。2.线程模式STA(SingleThreadedApartment)一个线程处理所有STA组件。UI线程通常为STA,负责消息处理和UI更新。MTA(MultiThreaded......
  • 2024华为云客服AI助手的大模型实践与思考(免费下载)
    【1】亲爱的读者,如果您想要下载文章完整版,请关注公众号并转发本文至您的微信朋友圈【2】公众号后台发送2024华为云客服AI助手的大模型实践与思考【3】即可获取本文对应的PDF学习文档。  ......
  • 新一代大语言模型 GPT-5 对工作与生活的影响及应对策略
    文章目录......
  • 6-1构建模型的3种方法
    可以使用以下三种方式构建模型:1.继承nn.Module基类构建自定义模型2.使用nn.Sequential按层顺序构建模型3.继承nn.Module基类构建模型并辅助应用模型容器进行封装(nn.Sequentail,nn.ModuleList,nn.ModuleDict)其中第一种方式最为常见,第二种方式最简单,第三种方式最为灵活也较为......
  • 调用大模型API帮我分析并写可执行代码
    本文以博主自己的一个具体任务为例,记录调用大模型来辅助设计奖励函数的过程。注1:博主的目标是在强化学习过程中(CARLA环境十字路口进行自动驾驶决策控制),通过调用大模型API进行奖励函数设计,进而生成可执行的奖励函数代码,并完成自动调用。以大模型具备的丰富知识,辅助进行奖励设计......