大模型输出参数说明

时间：2024-12-06 14:56:45浏览次数：7

参数名	含义	取值范围
engine	大模型后台推理引擎，目前可选的推理引擎有基础模型，古文模型，对话模型和翻译模型	‘base_10B’：基础模型 translate’：翻译模型 ‘dialog’：对话模型 '‘rhythm_poems’:古文模型
temprature	模拟退火温度参数。值越大，使得概率分布越尖锐，模型的创造性越强，但生成效果不稳定。值越小，模型的稳定性越强，生成效果稳定	float:[0,1]
max_tokens	最大生成 token 长度，数值越大，生成时间越长。不建议超过 200。	int:[0~200]
input_prefix	输入序列前缀，如设置，将自动为 query 和每个样例的输入加上前缀	任意字符串
input_suffix	输入序列后缀，如设置，将自动为 query 和每个样例的输入加上后缀	任意字符串
output_prefix	输出序列前缀，如设置，将自动为每个样例的输出加上前缀	任意字符串
output_suffix	输出序列后缀，如设置，将自动为每个样例的输出加上后缀	任意字符串
append_output_prefix_to_query	如设置，将自动将设定的输出前缀添加到 query 序列的末尾	bool 型
topK	挑选概率最高的 k 个 token 作为候选集。若 k 值为 1，则答案唯一。当 topK 为 0 时，该参数不起作用。	int：[0,-]
topP	token 的概率累加，从最大概率的 token 往下开始取，当取到累加值大于等于 topP 时停止。当 topP 为 0 时，该参数不起作用。	float：[0,1]
frequencyPenalty	重复惩罚参数，基于词出现的次数进行惩罚，出现的次数越多，该词在后文出现的概率越低，同时增强后文的创造性。当 frequencyPenalty 小于等于 1 时，该参数不起作用。值越大，惩罚度越高，后文重复度越低。一般设置为 1.2。	float:[1,-]
responsePenalty	重复惩罚参数，对出现过的词进行惩罚，降低其在后文出现的概率，同时增强后文的创造性。当 frequencyPenalty 大于 1 或 responsePenalty 小于等于 1 时，则该参数不起作用。值越大，惩罚度越高，后文重复度越低。	float:[1,-]
noRepeatNgramSize	重复词去除，表示输出中不包含长度为 noRepeatNgramSize 的重复词。当 noRepeatNgramSize 小于 1 时，则该参数不起作用。值越大，不能出现的重复词越长。	int:[0,-]

标签：输出,前缀,模型,后文,参数,值越
From： https://www.cnblogs.com/freedom-w/p/18590811

【comfyui教程：】ComfyUI | 最简单Flux模型入门教程，让你的图片告别AI味
前言最近有一款名为FLUX的AI绘画模型被誉为“小红书美女爆款风格制造机”，它产出的图片具有超强的的真实感，在AI圈超级火！像下面这几张美女图片，就是用的Flux模型FLUX模型产出的图片，具有超强的真实感。在小红书和视频号、抖音等社交媒体，热度极高。自从有了FLUX模型，小红......
已入职华为大模型算法岗，面试真的很水的…
觉得中大厂面试太难的，完全就是自己没准备充分，技术不到位，没准备的面试完全是浪费时间，更是对自己的不负责!今天我给大家分享一下我整理的大模型面试专题和答案，其中大部分都是面试常问的面试题，可以对照这查漏补缺奥！祝大家早日上岸呀！方向:大模型算法工程师整个面试持续了1小......
大语言模型 —— 使用RAG工具Anything LLM䢎本地部署AI大模型投喂数据，创建本地私有AI
相关：https://www.youtube.com/watch?v=77990wI3LZkhttps://anythingllm.com/https://ollama.com/......
OpenCV 创建图像时，CV_8UC1，CV_32FC3，CV_32S等参数的含义
形式：CV_<bit_depth>(S|U|F)C<number_of_channels>bit_depth：比特数---代表8bite,16bites,32bites,64bites...举个例子吧--比如说：如果你现在创建了一个存储--灰度图片的Mat对象,这个图像的大小为宽100,高100,那么,现在这张灰度图片中有10000个像素点，它每一个像素点在内存空间所占......
如果你真的想自学大模型，请参考我的方法，系统入门看这篇就够了！！
第一阶段：学习前置知识：Python基础、Linux基础学习目的：1.熟练掌握Python语言，熟悉常用的Python库和工具，如NumPy、Pandas、TensorFlow、PyTorch等。2.具备NLP相关的基础知识，包括文本预处理、分词、词性标注等。3.对大模型有一定了解，包括Transformer模型的结构......
所有大模型领域学习者必读论文，没有之一！由深度学习三巨头联合撰写！
本书介绍《深度学习》这篇论文是深度学习领域的一个里程碑，由三位领域内的领军人物——YannLeCun、YoshuaBengio和GeoffreyHinton——联手撰写。这篇综述性的文章首次集结了他们对深度学习的深刻见解，并在2015年发表于《自然》杂志上。尽管这篇论文已经发表了近十年，但它......
人工智能大模型培训讲师叶梓:Llama Factory 微调模型实战分享提纲
LLaMA-Factory——一个高效、易用的大模型训练与微调平台。它支持多种预训练模型，并且提供了丰富的训练算法，包括增量预训练、多模态指令监督微调、奖励模型训练等。LLaMA-Factory的优势在于其简单易用的界面和强大的功能。用户可以在不编写任何代码的情况下，在本地完成上百种预......
南科大龚欣课题组在ABCA蛋白结构和转运机制模型领域的研究进展
研究背景ABC转运蛋白（ATP-bindingcassettetransporter）是一类ATP驱动泵，在人类基因组已发现48种，分为7个亚家族（A-G）。ABC转运蛋白由两个跨膜结构域（TMD）和两个胞质侧ATP结合域（NBD）组成。TMD通过构象变化实现分子跨膜转运，NBD结合或水解胞浆中的ATP，确保转运底物所需能量。而在ABCA亚......
最新AI问答创作运营系统（SparkAi系统），GPT-4.0/GPT-4o多模态模型+联网搜索提问+问答分析+
目录一、人工智能系统介绍文档二、功能模块介绍系统快速体验三、系统功能模块3.1AI全模型支持/插件系统AI大模型多模态模型文档分析多模态识图理解能力联网搜索回复总结3.2AI智能体应用3.2.1AI智能体/GPTs商店3.2.2AI智能体/GPTs工作台3.2.3自定义创建AI智......
【大模型应用开发动手做AI Agent】具身智能的实现
【大模型应用开发动手做AIAgent】具身智能的实现关键词：大模型、AIAgent、具身智能、应用开发、深度学习、自然语言处理、计算机视觉、人机交互、机器人控制摘要：本文将探讨大模型在具身智能中的应用，通过动手实践构建一个AIAgent。文章首先介绍了大模型的基本概念和特......

大模型输出参数说明

相关文章

赞助商

阅读排行