首页 > 其他分享 >阿里云大模型Qwen系列输入参数说明

阿里云大模型Qwen系列输入参数说明

时间：2024-05-27 19:31:05浏览次数：27

标签：qwen 模型 stop 生成 Qwen token 阿里 array 输入

参数	数据类型	默认值	说明
model（必选）	string	无	指定用于对话的通义千问模型名，目前可选择qwen-turbo、qwen-plus、qwen-max、qwen-max-0403、qwen-max-0107、qwen-max-1201和qwen-max-longcontext。说明
messages	array	无	messages：用户与模型的对话历史。array中的每个元素形式为{"role":角色, "content": 内容}，角色当前可选值：system、user、assistant和tool。 system：表示系统级消息，用于指导模型按照预设的规范、角色或情境进行回应。是否使用system角色是可选的，如果使用则必须位于messages的最开始部分。 user和assistant：表示用户和模型的消息。它们应交替出现在对话中，模拟实际对话流程。 tool：表示工具的消息。在使用function call功能时，如果要传入工具的结果，需将元素的形式设为{"content":"工具返回的结果", "name":"工具的函数名", "role":"tool"}。其中name是工具函数的名称，需要和上轮response中的tool_calls[i]['function']['name']参数保持一致；content是工具函数的输出。参考代码给出了示例。 prompt：用户输入的指令，用于指导模型生成回复。说明
prompt	string	无（与messages不可同时为空）
seed（可选）	integer		生成时使用的随机数种子，用于控制模型生成内容的随机性。seed支持无符号64位整数。
max_tokens（可选）	integer	1500或2000	指定模型可生成的最大token个数。 qwen-turbo最大值和默认值为1500 tokens。 qwen-max、qwen-max-1201、qwen-max-longcontext和qwen-plus模型，最大值和默认值均为2000 tokens。
top_p（可选）	float		生成过程中的核采样方法概率阈值，例如，取值为0.8时，仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为（0,1.0)，取值越大，生成的随机性越高；取值越低，生成的确定性越高。
top_k（可选）	integer		生成时，采样候选集的大小。例如，取值为50时，仅将单次生成中得分最高的50个token组成随机采样的候选集。取值越大，生成的随机性越高；取值越小，生成的确定性越高。取值为None或当top_k大于100时，表示不启用top_k策略，此时，仅有top_p策略生效。
repetition_penalty（可选）	float		用于控制模型生成时的重复度。提高repetition_penalty时可以降低模型生成的重复度，1.0表示不做惩罚。没有严格的取值范围。
temperature（可选）	float		用于控制模型回复的随机性和多样性。具体来说，temperature值控制了生成文本时对每个候选词的概率分布进行平滑的程度。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。取值范围： [0, 2)，不建议取值为0，无意义。
stop (可选）	string or array	None	stop参数用于实现内容生成过程的精确控制，在模型生成的内容即将包含指定的字符串或token_id时自动停止。stop可以为string类型或array类型。 string类型当模型将要生成指定的stop词语时停止。例如将stop指定为"你好"，则模型将要生成“你好”时停止。 array类型 array中的元素可以为token_id或者字符串，或者元素为token_id的array。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。以下为stop为array时的示例（tokenizer对应模型为qwen-turbo）： 1.元素为token_id： token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为[108386,104307]，则模型将要生成“你好”或者“天气”时停止。 2.元素为字符串：设定stop为["你好","天气"]，则模型将要生成“你好”或者“天气”时停止。 3.元素为array： token_id为108386和103924分别对应token为“你好”和“啊”，token_id为35946和101243分别对应token为“我”和“很好”。设定stop为[[108386, 103924],[35946, 101243]]，则模型将要生成“你好啊”或者“我很好”时停止。说明 stop为array类型时，不可以将token_id和字符串同时作为元素输入，比如不可以指定stop为["你好",104307]。
stream (可选）	boolean	False	用于控制是否使用流式输出。当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，默认每次输出为当前生成的整个序列，最后一次输出为最终全部生成结果，可以通过设置参数incremental_output为False改变输出模式为非增量输出。
enable_search（可选）	boolean	False	用于控制模型在生成文本时是否使用互联网搜索结果进行参考。取值如下： True：启用互联网搜索，模型会将搜索结果作为文本生成过程中的参考信息，但模型会基于其内部逻辑判断是否使用互联网搜索结果。 False（默认）：关闭互联网搜索。
result_format（可选）	string	text	用于指定返回结果的格式，默认为text，也可选择message。当设置为message时，输出格式请参考返回结果。推荐您优先使用message格式。
incremental_output (可选）	boolean	False	控制在流式输出模式下是否开启增量输出，即后续输出内容是否包含已输出的内容。设置为True时，将开启增量输出模式，后面输出不会包含已经输出的内容，您需要自行拼接整体输出；设置为False则会包含已输出的内容。您可以参考流式输出代码。默认False： I I like I like apple True: I like apple 该参数只能在stream为True时使用。说明
tools	array	None	用于指定可供模型调用的工具库，一次function call流程模型会从中选择其中一个工具。tools中每一个tool的结构如下： type，类型为string，表示tools的类型，当前仅支持function。 function，类型为object，键值包括name，description和parameters： name：类型为string，表示工具函数的名称，必须是字母、数字，可以包含下划线和短划线，最大长度为64。 description：类型为string，表示工具函数的描述，供模型选择何时以及如何调用工具函数。 parameters：类型为object，表示工具的参数描述，需要是一个合法的JSON Schema。JSON Schema的描述可以见链接。参考代码中给出了参数描述的示例。如果parameters参数为空，表示function没有入参。使用tools时需要同时指定result_format为message。在function call流程中，无论是发起function call的轮次，还是向模型提交工具函数的执行结果，均需设置tools参数。当前支持的模型包括qwen-turbo、qwen-plus、qwen-max和qwen-max-longcontext。说明

标签：qwen,模型,stop,生成,Qwen,token,阿里,array,输入
From： https://blog.csdn.net/zengzizi/article/details/139087139

相关文章

阿里重排论文PRM 《Personalized Re-ranking for Recommendation》
和DLCM做法类似，都是使用序列模型对rank后的结构做rerank，不同点是PRM使用了transformencoder来建模，并且使用了用户预训练向量和位置向量最后一层使用了softmax来计算每个item被点击的概率（论文提到使用click作为label，也就是所存在多个label为1的情况，不知道有没有做什么特殊处理），并......
阿里面试：NIO为什么会导致CPU100%？
在Java中总共有三种IO类型：BIO（BlockingI/O，阻塞I/O）、NIO（Non-blockingI/O，非阻塞I/O）和AIO（AsynchronousI/O，异步I/O），它们的区别如下：在JDK1.4之前，只有BIO一种模式，其开发过程相对简单，新来一个连接就会创建一个新的线程处理，但随着请求并发度的提升，BIO很快遇到了性能瓶颈。......
腾讯云全面下调混元大模型价格字节豆包、阿里千问、百度API接口费用对比入口
大家好，我是AI科技智库（www.aigchouse.com），国内Top10计算机博士毕业，创办了一站式AI工具、资料、课程资源学习平台，每日持续更新。通过分享最新AI工具、资源、变现指南等，帮助更多人了解使用AI，提升工作和学习效率。这里有海量AI工具整合包、AI变现指南、AI学习资料、AI免......
html解决浏览器记住密码输入框的问题
浏览器通常会记住用户在表单中输入的信息，包括密码字段。这是通过表单的autocomplete属性来控制的。如果你希望浏览器不要记住密码字段的输入，可以设置autocomplete属性为off或new-password。以下是一个HTML表单示例，展示如何禁止浏览器记住密码字段： <!DOCTYPEhtml><htmllang......
完成一个猜数字游戏进入程序后提示用户输入要猜的数字其他人输入时，提示数字大了，或者
print("---------------欢迎来到猜数字游戏------------")print("游戏规则：每位玩家只能猜5次，5次猜错结束程序,显示正确的数字后，重新开始")count=0whilecount<=5:num=int(input("请输入你要猜测的数字："))system_num=random.randint(1,100)ifnum>system_num:......
FunClip - 阿里打造的创意魔剪：一键自动化短视频编辑，高效解锁视觉盛宴！
......
Python限制输入的数范围
在Python中，我们可以使用多种方法来限制用户输入的数值范围。1.使用while循环和try-except语句的方法以下是一个使用while循环和try-except语句的示例，该示例将要求用户输入一个在指定范围内的整数。假设我们要限制用户输入的数在1到100之间（包括1和100）：defget_valid_input(min_v......
centos7 更换阿里源
一、环境准备你需要准备一台干净的CentOS7的环境，且可以ping的通外网~尤其是mirrors.aliyun.com。简单测试一下，如果通的话，再执行以下步骤完成设置。pingmirrors.aliyun.com二、手动配置阿里云源备份官方的原yum源的配置mv/etc/yum.repos.d/CentOS-Base.repo/etc/yum.re......
TAS5711带EQ和DRC支持2.1声道的20W立体声8V-26V数字输入开环D类数字功放音频放大器
前言数字功放很难搞，寄存器很多，要配置正确才有声音，要想声音好，要好好调整。TAS5711出道很多年了，现在仍然在不少功放、音箱中能看到。TAS5711特征音频输入/输出从18V电源向8Q负载提供20W功率宽PVDD范围：8V至26V高效的D类操作，无需散热器一个串行音频输入（两个音......
三菱works3库系列2-密码等级输入修改FB（上）
1处理密码等级和修改等级（建议修改等级权限最高）2根据密码等级，比较密码输入，此例中D1000~D1010预设了5组密码，输入正确后会置位5个标志位M1000~M1004，用来做权限和隐藏之类，密码输入正确或者错误都会出来对应标志位用来提示，并清空输入的密码3注销，会复位M1000~M1004，并清空密码......

赞助商

阅读排行