大模型中的tempture以及top-p问题

时间：2024-07-14 21:51:42浏览次数：22

标签：采样输出概率 top tempture 模型温度

原文：https://blog.csdn.net/jarodyv/article/details/128994176

参考：https://blog.csdn.net/engchina/article/details/138258047

为了使大模型的生成和表达更加多样，GPT采用了tempture以及top-p方法。当然还有限制大模型字数的方法（max_tokens = 50 ）。

GPT的输出层后面一般跟着softmax，在判别式模型中我们会输出概率最高的那一类别。

这样的贪心策略会使得模型的输出相对固定，生成内容很死板。因此提出了此两种方法。

top_p采样

chatgpt采用一种top-p方法来进行采样，解决该问题。简而言之，就是对结果从高到低排序，按累积概率p截尾去掉概率小的分布，最后筛选得到几个概率较高的结果，归一化后按分布抽样。

温度采样

温度采样受统计热力学的启发，高温意味着更可能遇到低能态。在概率模型中，logits 扮演着能量的角色，我们可以通过将 logits 除以温度来实现温度采样，然后将其输入 Softmax 并获得采样概率。
越低的温度使模型对其首选越有信心，而高于 1 的温度会降低信心。0 温度相当于 argmax 似然，而无限温度相当于于均匀采样。
温度采样中的温度与玻尔兹曼分布有关，其公式如下所示：

该式就是softmax的变体，T值越大时，结果越呈现一种均匀分布。

此外还有频率惩罚（frquency_penalty）、存在惩罚（presence_penalty），使大模型有更大的概率输出从未使用的词语，去除重复的输出或提示。

最后，还有likehood，生成新词时，会为每一个词赋likehood值，某词的likehood值越高，则越有可能在下一轮输出某词。

标签：采样,输出,概率,top,tempture,模型,温度
From： https://www.cnblogs.com/xmds/p/18302077

常曲率空间的扭积模型
定理2.2.1设\(Q^n_\lambda\)表示常曲率为\(\lambda\)的单连通空间形式，且\(p\)是\(Q^n_\lambda\)中的一个点。那么当\(\lambda\leq0\)时，\(Q^n_\lambda\setminus\{p\}=(0,\infty)\times_{s^2_\lambda}S^{n-1}(1)\)；当\(\lambda>0\)时，\(Q^n_\lam......
模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 -Plugin
......
MEGALODON：突破传统，实现高效无限上下文长度的大规模语言模型预训练和推理
在人工智能领域，尤其是在自然语言处理（NLP）中，大模型（LLMs）的预训练和推理效率一直是研究的热点。最近，一项突破性的研究提出了一种新型神经网络架构——MEGALODON，旨在解决传统Transformer架构在处理长序列时面临的挑战。MEGALODON-7B、LLAMA2-7B和LLAMA2-13B在训练过程中处理......
模型部署 - TensorRT - NVIDIA 讲 TensorRT - 8.6.1版本 - 5种工具
......
关于Kafka Topic分区和Replication分配的策略
文章目录1.Topic多分区2.理想的策略3.实际的策略4.如何自定义策略1.Topic多分区如图，是一个多分区Topic在Kafka集群中可能得分配情况。P0-RL代表分区0，Leader副本。这个Topic是3分区2副本的配置。分区尽量均匀分在不同的Broker上，分区的Follower副本尽量不和Lea......
STAThread与Windows UI线程模型
STAThread与WindowsUI线程模型1.STAThread属性标注Main方法，使主线程运行在STA模式。用于兼容需要STA环境的COM组件，特别是UI组件。2.线程模式STA(SingleThreadedApartment)一个线程处理所有STA组件。UI线程通常为STA，负责消息处理和UI更新。MTA(MultiThreaded......
2024华为云客服AI助手的大模型实践与思考（免费下载）
【1】亲爱的读者，如果您想要下载文章完整版，请关注公众号并转发本文至您的微信朋友圈【2】公众号后台发送2024华为云客服AI助手的大模型实践与思考【3】即可获取本文对应的PDF学习文档。 ......
新一代大语言模型 GPT-5 对工作与生活的影响及应对策略
文章目录......
6-1构建模型的3种方法
可以使用以下三种方式构建模型：1.继承nn.Module基类构建自定义模型2.使用nn.Sequential按层顺序构建模型3.继承nn.Module基类构建模型并辅助应用模型容器进行封装（nn.Sequentail,nn.ModuleList,nn.ModuleDict）其中第一种方式最为常见，第二种方式最简单，第三种方式最为灵活也较为......
调用大模型API帮我分析并写可执行代码
本文以博主自己的一个具体任务为例，记录调用大模型来辅助设计奖励函数的过程。注1：博主的目标是在强化学习过程中（CARLA环境十字路口进行自动驾驶决策控制），通过调用大模型API进行奖励函数设计，进而生成可执行的奖励函数代码，并完成自动调用。以大模型具备的丰富知识，辅助进行奖励设计......

大模型中的tempture以及top-p问题

相关文章

赞助商

阅读排行