首页 > 其他分享 >ollama的set parameter的参数的注解

ollama的set parameter的参数的注解

时间:2024-08-14 14:58:24浏览次数:10  
标签:set parameter 生成 tokens num GPU ollama

>>> /set parameter 
Available Parameters:
  /set parameter seed <int>             Random number seed
  /set parameter num_predict <int>      Max number of tokens to predict
  /set parameter top_k <int>            Pick from top k num of tokens
  /set parameter top_p <float>          Pick token based on sum of probabilities
  /set parameter num_ctx <int>          Set the context size
  /set parameter temperature <float>    Set creativity level
  /set parameter repeat_penalty <float> How strongly to penalize repetitions
  /set parameter repeat_last_n <int>    Set how far back to look for repetitions
  /set parameter num_gpu <int>          The number of layers to send to the GPU
  /set parameter stop <string> <string> ...   Set the stop parameters

这些参数用于配置模型的推理过程,影响生成文本的方式。下面是对这些参数的解释,特别是如何在多 GPU 环境下进行设置。

参数解释

  1. seed <int>

    • 设置随机数种子,用于控制生成过程中的随机性。相同的种子会导致相同的输出,适用于需要可重复结果的场景。
  2. num_predict <int>

    • 生成的最大 tokens 数量,控制生成的文本长度。
  3. top_k <int>

    • 从前 k 个概率最高的 tokens 中挑选下一个 token。较低的值使生成更加确定性,较高的值增加生成的多样性。
  4. top_p <float>

    • 基于累积概率选择 tokens。top_p 越低,生成结果越集中于高概率 tokens。
  5. num_ctx <int>

    • 设置上下文的大小,决定模型能“记住”多少个 tokens。在生成长文本时较为重要。
  6. temperature <float>

    • 控制生成的创造性。值越高,生成的文本越具有创造性和多样性。值越低,生成结果更确定性。
  7. repeat_penalty <float>

    • 设置重复惩罚的强度,值越高,模型越会避免重复相同的 tokens。
  8. repeat_last_n <int>

    • 设置模型回顾历史 tokens 的长度,用于重复惩罚。
  9. num_gpu <int>

    • 设置用于处理模型的 GPU 数量,特别适用于多 GPU 系统。你可以将模型的某些层发送到 GPU 上,以利用 GPU 的加速能力。

    • 如果有多个 GPU 卡

      • 你可以设置 num_gpu 的值为你想要使用的 GPU 数量。如果你有 4 张 GPU,可以设置 num_gpu 4 来让模型使用所有 4 张 GPU 进行推理。
      • 这将分配模型的计算任务到多个 GPU,利用每张 GPU 的显存和计算能力。
  10. stop <string> <string> ...

    • 设置生成文本时的终止条件,模型在生成这些字符串时将停止生成。

多 GPU 设置

在多 GPU 环境中,num_gpu 参数非常关键。假设你有 4 张 GPU,可以使用以下命令来设置:

/set parameter num_gpu 4

这个设置会使模型在推理过程中使用 4 张 GPU,自动分配计算任务到不同的 GPU 上,以更高效地利用硬件资源。

总结

  • num_gpu 参数允许你设置模型使用的 GPU 数量,在多 GPU 环境中尤为重要。
  • 其他参数控制模型生成文本的方式,如生成的文本长度、重复惩罚、生成的创造性等。
  • 根据你的硬件和需求配置这些参数可以显著影响生成的效率和质量。

标签:set,parameter,生成,tokens,num,GPU,ollama
From: https://blog.csdn.net/sunyuhua_keyboard/article/details/141191311

相关文章

  • .Net Core appsettings.json详解 (多环境配置)
    前言在实际开发中一般分为开发环境与生产环境,不同环境下部分配置会有所不同,例如数据库连接字符串等。.NetCore框架中提供了三个值,Development(开发),Staging(分阶段),Production(生产环境),可以根据这三个值配置不同环境。创建appsettings文件创建项目时系统默认创建appsettin......
  • vue 图片资源应该如何存放并引入(public、assets)?
    public放不会变动的文件(相当于vue-cli2.x中的static)public/目录下的文件并不会被Webpack处理:它们会直接被复制到最终的打包目录(默认是dist/static)下。必须使用绝对路径引用这些文件,这个取决于你vue.config.js中publicPath的配置,默认的是/。assets放可能会变动的文件assets目录......
  • pytest-setup/teardown
    Pytest提供了类似unittest的setup、teardown的方法,并且还超过四个,一共有十种模块级别:setup_module、teardown_module---模块前置setup_module和后置teardown_module,放类外生效,整个.py模块开始前和结束后各调用一次函数级别:setup_function、teardown_function---函数前置setup_......
  • LLM大模型部署实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开
    LLM大模型部署实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开发1.Ollama部署的本地模型(......
  • 方天云智慧平台系统 setImg.ashx 文件上传致RCE漏洞复现
    0x01产品简介方天云智慧平台系统,作为方天科技公司的重要产品,是一款面向企业全流程的业务管理功能平台,集成了ERP(企业资源规划)、MES(车间执行系统)、APS(先进规划与排程)、PLM(产品生命周期)、CRM(客户关系管理)等多种功能模块,旨在通过云端服务为企业提供数字化、智能化的管理解决方案......
  • superset配置
    安装下载了最新源码包wgethttps://github.com/apache/superset/archive/refs/tags/4.0.2.tar.gz解压进入目录,这里有两个docker-compose文件docker-compose-non-dev.yml少很多功能,不会拷贝superset目录到容器中,不会对config.py复写docker-compose.yml文件中会将包内文件挂......
  • Lombok 使用教程-@Accessors | 自定义getters和setters的生成格式
    作者简介:大家好,我是smart哥,前中兴通讯、美团架构师,现某互联网公司CTO联系qq:184480602,加我进群,大家一起学习,一起进步,一起对抗互联网寒冬学习必须往深处挖,挖的越深,基础越扎实!阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析......
  • HashSet底层add方法去重例题 day14
    测试类packagecom.shujia.day14;importjava.util.HashSet;/*使用Set集合存储自定义对象,当对象的姓名和年龄都一样的时候,将这两个对象认为是重复了,进行去重HashSet:底层数据结构是哈希表*/publicclassSetDemo2{publicstaticvoidmain(String[]ar......
  • Java入门基础16:集合框架1(Collection集合体系、List、Set)
    集合体系结构Collection是单列集合的祖宗,它规定的方法(功能)是全部单列集合都会继承的。collection集合体系Collection的常用方法packagecom.itchinajie.d1_collection;importjava.util.ArrayList;importjava.util.HashSet;/**目标:认识Collection体系的特点。*......
  • LinkedHashSet day14
    /*LinkedHashSet是继承自HashSet类,底层数据结构是哈希表和双链表,哈希表保证了元素的唯一性,双链表保证了元素的有序Collection:接口-List(元素有序且可以发生重复,且有索引的概念)-ArrayList(底层数据结构是数组,查询快,增删慢,线程......