标签:采样 logit Top token 参数 含义 top
目录
大语言模型的超参数含义
Top-P 采样
频率惩罚(Frequency Penalty)
top_k:
logit_bias:
top_logprobs:
max_tokens:
大语言模型的超参数含义
Top-P 采样
- 含义:一种采样替代方法,称为核采样。模型考虑top_p概率质量的token结果。例如,0.1表示仅考虑组成前10%概率质量的token。
- 作用:这种方法可以限制输出序列的长度,并仍然保持样本的一定多样性。
频率惩罚(Frequency Penalty)
- 含义:该参数的值范围为-2.0到2.0。正值会对新token进行惩罚,基于其在当前文本中的出现
标签:采样,
logit,
Top,
token,
参数,
含义,
top
From: https://blog.csdn.net/qq_38998213/article/details/141786058