首页 > 其他分享 >如何优雅的使用ollama| 京东云技术团队

如何优雅的使用ollama| 京东云技术团队

时间:2024-05-13 14:53:13浏览次数:16  
标签:模型 llama3 优雅 GB 京东 ollama 70b latest

 

入门开源大语言模型,最好的工具就是ollama,这是一款简单的大模型本地部署框架,支持基于命令行的方式运行多种大语言模型,并提供了相应的Python和JS SDK,可以基于此方便实现Chatbot UI。这篇文章就以京东云智算平台为例(其他平台也是类似,甚至可以在本地电脑运行),分享如何一键安装ollama的基本操作。

首先,在控制台创建GPU实例,待实例状态为运行中后,一键安装ollama应用。如果要手动安装,可以参考ollama的官网,但下载模型需要一段等待时间。

 

安装完成后,点击自定义应用,就可以看到ollama Web UI,平台预置了llama2-7b(latest),llama3-8b(latest), llama3-70b, qwen-4b(latest)模型,如果需要更多的模型,可以使用ollama pull命令进行下载,ollama官方的模型仓库参见这里:
https://ollama.com/library。

 

我租的GPU显卡是4090(平台给的名字叫GN-FP32-83 24G * 1卡),运行llama3-8b,llama2和qwen都很快,但运行llama3-70b就会非常慢,好在llama3-70b废话不多,直接回答了问题。下图中第一个回答是llama3-8b的,第二个回答是llama3-70b的。

 

我们可以基于ollama提供的命令行工具,基于ollama modelfile功能,构建自己的ollama模型,modelefile的原理和写法都和Dockerfile类似,下面我会演示如何基于模型的System Message能力,使用ollama modelfile构建一个幼儿园老师的角色扮演Chatbot。

随便在某个目录下创建一个名为Modelfile的文件(文件名也可以不叫这个),例如我的文件路径为:/data/Modelfile,其内容如下:

FROM llama3:latest
SYSTEM """
你是一名育儿专家,会以幼儿园老师的方式回答2~6岁孩子提出的各种天马行空的问题。语气与口吻要生动活泼,耐心亲和;答案尽可能具体易懂,不要使用复杂词汇,尽可能少用抽象词汇;答案中要多用比喻,必须要举例说明,结合儿童动画片场景或绘本场景来解释;需要延展更多场景,不但要解释为什么,还要告诉具体行动来加深理解。
"""

在JupyterLab自带的终端中,使用ollama命令行工具构建模型

ollama create teacher -f /data/Modelfile

构建完成后,就可以通过ollama list命令看到新生成的teacher模型

(ollama) root@dep-ns-5e24bda738cf-1715268602511-d6d46545-cht86:/data/apps/ollama# ollama list
NAME            ID              SIZE    MODIFIED       
llama2:latest   78e26419b446    3.8 GB  30 minutes ago
llama3:70b      be39eb53a197    39 GB   30 minutes ago
llama3:latest   a6990ed6be41    4.7 GB  30 minutes ago
qwen:latest     d53d04290064    2.3 GB  30 minutes ago
teacher:latest  480a154551b5    4.7 GB  13 seconds ago

点击控制台的自定义应用,在打开的页面上,可以在我们的Web UI上和它进行对话,效果如下:

 

再对比下原来llama3的回答,就能轻松看到效果了。

 

在使用llama的过程中,我发现llama对中文的支持并不好,它可以理解中文,但回答却总是用英语进行。如何构建自己的llama3中文模型,这方面的内容我们在后续的文章再进行分析。

作者:京东科技 彭建宏

来源:京东云开发者社区

标签:模型,llama3,优雅,GB,京东,ollama,70b,latest
From: https://www.cnblogs.com/Jcloud/p/18189235

相关文章

  • OSS_PIPE:Rust编写的大规模文件迁移工具| 京东云技术团队
    文盘rust好久没有更新了。这段时间笔者用rust写了个小东西,跟各位分享一下背景随着业务的发展,文件数量和文件大小会急剧增加,文件迁移的数量和难度不断攀升。oss_pipe是rust编写的文件迁移工具,旨在支撑大规模的文件迁移场景。编写oss_pipe的初衷•同类产品面临的问题•rust......
  • 什么? 20分钟,构建你自己的LLaMA3应用程序! | 京东云技术团队
    4月19日,Meta发布了最新的大语言模型LLaMA3,具体包括一个8B模型和一个70B模型,上下文长度支持8K,被誉为史上最强开源大语言模型,开源社区的“重磅炸弹”,效果直指GTP4。在诸多评测任务上,LLaMA3都有非常炸裂的效果。8B模型在多项指标中超越了Gemma7B和Mistral7BInstruct,而70B模......
  • # 如何优雅的写出二分
    二分查找二分法查找单个值题目:给定一个n个有序的(升序)数组nums和一个目标值target,写一个函数搜索nums中target,如果目标值存在返回下标,否则返回-1;关键词:有序数组,无重复元素难点:区间选择及循环不变量在每次循环中要坚持循环不变量原则(名字不重要,怎么做很重要)  如果我们在......
  • 华为云发布CodeArts IDE for Python,极致优雅云原生开发体验
    近日,华为云正式发布CodeArtsIDEforPython,这是一款内置华为自主创新的Python语言服务,提供智能编程、灵活调试能力的可扩展桌面开发工具,为华为云开发者提供卓越Python编码体验。Python作为一种编程语言,广泛用于Web应用程序、软件开发、数据科学和机器学习(ML)。Python以其优......
  • 更优雅的使用Gson解析Json
     Gson背靠Google这棵大树,拥有广泛的社区支持和相对丰富的文档资源,同时因其简单直观的API,一直以来基本稳坐Android开发序列化的头把交椅(直到Google宣布kotlin成为Android开发的首选语言)。本文对Gson的使用及主要流程做下分析。Gson的基本使用Gson依赖 kotlin复制代码d......
  • 【京东云新品发布月刊】2024年4月产品动态
    京东云4月产品动态:1.【言犀AI虚拟主播】"采销东哥"数字人是怎样练成的?“大家好,好久不见,我是你们的老朋友东哥……”面对众网友喊话开直播,刘强东以新的形式与大家见面。4月16日下午6点18分,由京东云言犀打造的“采销东哥”AI数字人开启直播首秀,同时亮相京东家电家居、京东超市采销直......
  • mac本地搭建ollama
    mac本地搭建ollamawebUI*简介:ollama-webUI是一个开源项目,简化了安装部署过程,并能直接管理各种大型语言模型(LLM)。本文将介绍如何在你的macOS上安装Ollama服务并配合webUI调用api来完成聊天。开源地址https://github.com/812781385/ollama-webUI.git,开源不易感谢star微信公众......
  • Python 如何优雅的操作 PyMySQL
    一、PyMysql在使用Python操作MySQL数据过的过程中,基本的增删改查操作如何更加高效优雅的执行。这里将以PyMySQL为例,介绍一下如何使用Python操作数据库。Python对MySQL数据库进行操作,基本思路是先连接数据库Connection对象,建立游标Cursor对象,然后执行SQL语句对数据库进行操作......
  • 如何写出优雅的代码,程序员都要了解的开闭原则
    开闭原则(Open-ClosedPrinciple,OCP)是面向对象编程中的重要原则之一。它指出软件实体(如类、模块、函数等)应该对扩展开放,对修改关闭。要写出优雅的代码,可以考虑以下几点:良好的结构和设计:合理划分模块,保持代码的清晰性和可读性。单一职责原则:每个类或函数只负责一项特定的功能。......
  • 华为云开发者桌面全新发布CodeArts IDE for Python,极致优雅云原生开发体验
    本文分享自华为云社区《华为云发布CodeArtsIDEforPython,极致优雅云原生开发体验》,作者:华为云头条。近日,华为云正式发布CodeArtsIDEforPython,这是一款内置华为自主创新的Python语言服务,提供智能编程、灵活调试能力的可扩展桌面开发工具,为华为云开发者提供卓越Python编码体验......