ollama的set parameter的参数的注解

时间：2024-08-14 14:58:24浏览次数：18

标签：set parameter 生成 tokens num GPU ollama

>>> /set parameter 
Available Parameters:
  /set parameter seed <int>             Random number seed
  /set parameter num_predict <int>      Max number of tokens to predict
  /set parameter top_k <int>            Pick from top k num of tokens
  /set parameter top_p <float>          Pick token based on sum of probabilities
  /set parameter num_ctx <int>          Set the context size
  /set parameter temperature <float>    Set creativity level
  /set parameter repeat_penalty <float> How strongly to penalize repetitions
  /set parameter repeat_last_n <int>    Set how far back to look for repetitions
  /set parameter num_gpu <int>          The number of layers to send to the GPU
  /set parameter stop <string> <string> ...   Set the stop parameters

这些参数用于配置模型的推理过程，影响生成文本的方式。下面是对这些参数的解释，特别是如何在多 GPU 环境下进行设置。

参数解释

seed <int>
- 设置随机数种子，用于控制生成过程中的随机性。相同的种子会导致相同的输出，适用于需要可重复结果的场景。
num_predict <int>
- 生成的最大 tokens 数量，控制生成的文本长度。
top_k <int>
- 从前 k 个概率最高的 tokens 中挑选下一个 token。较低的值使生成更加确定性，较高的值增加生成的多样性。
top_p <float>
- 基于累积概率选择 tokens。top_p 越低，生成结果越集中于高概率 tokens。
num_ctx <int>
- 设置上下文的大小，决定模型能“记住”多少个 tokens。在生成长文本时较为重要。
temperature <float>
- 控制生成的创造性。值越高，生成的文本越具有创造性和多样性。值越低，生成结果更确定性。
repeat_penalty <float>
- 设置重复惩罚的强度，值越高，模型越会避免重复相同的 tokens。
repeat_last_n <int>
- 设置模型回顾历史 tokens 的长度，用于重复惩罚。
num_gpu <int>
- 设置用于处理模型的 GPU 数量，特别适用于多 GPU 系统。你可以将模型的某些层发送到 GPU 上，以利用 GPU 的加速能力。
- 如果有多个 GPU 卡：
  - 你可以设置 num_gpu 的值为你想要使用的 GPU 数量。如果你有 4 张 GPU，可以设置 num_gpu 4 来让模型使用所有 4 张 GPU 进行推理。
  - 这将分配模型的计算任务到多个 GPU，利用每张 GPU 的显存和计算能力。
stop <string> <string> ...
- 设置生成文本时的终止条件，模型在生成这些字符串时将停止生成。

多 GPU 设置

在多 GPU 环境中，num_gpu 参数非常关键。假设你有 4 张 GPU，可以使用以下命令来设置：

/set parameter num_gpu 4

这个设置会使模型在推理过程中使用 4 张 GPU，自动分配计算任务到不同的 GPU 上，以更高效地利用硬件资源。

总结

num_gpu 参数允许你设置模型使用的 GPU 数量，在多 GPU 环境中尤为重要。
其他参数控制模型生成文本的方式，如生成的文本长度、重复惩罚、生成的创造性等。
根据你的硬件和需求配置这些参数可以显著影响生成的效率和质量。

标签：set,parameter,生成,tokens,num,GPU,ollama
From： https://blog.csdn.net/sunyuhua_keyboard/article/details/141191311

.Net Core appsettings.json详解（多环境配置）
前言在实际开发中一般分为开发环境与生产环境，不同环境下部分配置会有所不同，例如数据库连接字符串等。.NetCore框架中提供了三个值，Development(开发),Staging(分阶段),Production(生产环境)，可以根据这三个值配置不同环境。创建appsettings文件创建项目时系统默认创建appsettin......
vue 图片资源应该如何存放并引入（public、assets）？
public放不会变动的文件（相当于vue-cli2.x中的static）public/目录下的文件并不会被Webpack处理：它们会直接被复制到最终的打包目录（默认是dist/static）下。必须使用绝对路径引用这些文件，这个取决于你vue.config.js中publicPath的配置，默认的是/。assets放可能会变动的文件assets目录......
pytest-setup/teardown
Pytest提供了类似unittest的setup、teardown的方法，并且还超过四个，一共有十种模块级别：setup_module、teardown_module---模块前置setup_module和后置teardown_module，放类外生效，整个.py模块开始前和结束后各调用一次函数级别：setup_function、teardown_function---函数前置setup_......
LLM大模型部署实战指南：Ollama简化流程，OpenLLM灵活部署，LocalAI本地优化，Dify赋能应用开
LLM大模型部署实战指南：Ollama简化流程，OpenLLM灵活部署，LocalAI本地优化，Dify赋能应用开发1.Ollama部署的本地模型(......
方天云智慧平台系统 setImg.ashx 文件上传致RCE漏洞复现
0x01产品简介方天云智慧平台系统，作为方天科技公司的重要产品，是一款面向企业全流程的业务管理功能平台，集成了ERP（企业资源规划）、MES（车间执行系统）、APS（先进规划与排程）、PLM（产品生命周期）、CRM（客户关系管理）等多种功能模块，旨在通过云端服务为企业提供数字化、智能化的管理解决方案......
superset配置
安装下载了最新源码包wgethttps://github.com/apache/superset/archive/refs/tags/4.0.2.tar.gz解压进入目录，这里有两个docker-compose文件docker-compose-non-dev.yml少很多功能，不会拷贝superset目录到容器中，不会对config.py复写docker-compose.yml文件中会将包内文件挂......
Lombok 使用教程-@Accessors | 自定义getters和setters的生成格式
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析......
HashSet底层add方法去重例题 day14
测试类packagecom.shujia.day14;importjava.util.HashSet;/*使用Set集合存储自定义对象,当对象的姓名和年龄都一样的时候,将这两个对象认为是重复了,进行去重HashSet:底层数据结构是哈希表*/publicclassSetDemo2{publicstaticvoidmain(String[]ar......
Java入门基础16：集合框架1（Collection集合体系、List、Set）
集合体系结构Collection是单列集合的祖宗，它规定的方法（功能）是全部单列集合都会继承的。collection集合体系Collection的常用方法packagecom.itchinajie.d1_collection;importjava.util.ArrayList;importjava.util.HashSet;/**目标：认识Collection体系的特点。*......
LinkedHashSet day14
/*LinkedHashSet是继承自HashSet类,底层数据结构是哈希表和双链表,哈希表保证了元素的唯一性,双链表保证了元素的有序Collection:接口-List(元素有序且可以发生重复,且有索引的概念)-ArrayList(底层数据结构是数组,查询快,增删慢,线程......

ollama的set parameter的参数的注解

参数解释

多 GPU 设置

总结

相关文章

赞助商

阅读排行