首页 > 其他分享 >开源大模型部署——ollama

开源大模型部署——ollama

时间:2024-06-19 22:27:56浏览次数:11  
标签:8080 -- 模型 MaxKB 开源 maxkb docker ollama

开源大模型部署——ollama

文章目录


前言

本文是基于ollama来部署llama3大模型的一个例子,在ollama官网库中有其他模型(qwen2、phi3等)选择。


一、下载并安装ollama

Ollama官网下载地址:https://ollama.com/download
在这里插入图片描述
安装成功后打开cmd输入ollama,若出现如下内容,则代表安装成功。

C:\Users\78609>ollama
Usage:
  ollama [flags]
  ollama [command]

Available Commands:
  serve       Start ollama
  create      Create a model from a Modelfile
  show        Show information for a model
  run         Run a model
  pull        Pull a model from a registry
  push        Push a model to a registry
  list        List models
  ps          List running models
  cp          Copy a model
  rm          Remove a model
  help        Help about any command

Flags:
  -h, --help      help for ollama
  -v, --version   Show version information

二、下载模型(以llama3的4b模型为例)

在cmd中输入

ollama run llama3

下载成功后就可以进行使用。
下载成功后就可以进行使用
在这里插入图片描述

三、部署前端界面(MaxKB)

电脑上要有docker

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data cr2.fit2cloud.com/1panel/maxkb

完成安装
MaxKB在GitHub上的代码
在这里插入图片描述
MaxKB在Ubuntu 22.04 / CentOS 7部署&离线部署教程

四、使用web界面部署模型

输入网址http://127.0.0.1:8080/
输入用户名: admin密码: MaxKB@123..
在这里插入图片描述
登录成功后创建应用
在这里插入图片描述
选择模型
在这里插入图片描述

注意注意
MaxKB 版本为 0.9.0,API 域名格式为:http://您ollama所在服务的ip地址:您ollama的端口号/v1 MaxKB 版本为 0.9.1及之后的版本API 域名格式:http://您ollama所在服务的ip地址:您ollama的端口号/ 注意:API 域名不可使用 127.0.0.1 或 localhost。
API域名填写为http://host.docker.internal:11434
在这里插入图片描述
演示效果
在这里插入图片描述

五、注意事项

问题1:API 域名无效
解决方法:API域名填写为http://host.docker.internal:11434


问题2:用docker安装之后,然后重启容器之后数据全部丢失,能不能不让丢失。确定是用 docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb 启动的。
解决方法:启动的时候添加 --privileged=true
比如将数据挂载到D盘
docker run -d --name=maxkb -p 8080:8080 -v D:/maxkb/data:/var/lib/postgresql/data --privileged=true 1panel/maxkb
如果启动还是报错,那就需要使用wsl子系统

Windows PowerShell命令行窗口在Windows系统开始那里
先安装WSL(管理员运行Windows PowerShell:wsl --update)
安装Ubuntu(管理员运行Windows PowerShell:wsl --install -d Ubuntu),运行后要设置帐号密码,注:输入密码时,密码不会显示在命令行窗口,不要惊慌,实际已设置好了。
官网下载安装Docker后注册帐号(需科学上网),在Docker软件设置里,找到“Resource”项→"WSL integration"项,将“Enable integration with my default wSL distro”打勾,将“Ubuntu”打开。后连接Docker(管理员运行Windows PowerShell:docker login)
Docker是国外的软件,日常使用需加速,不加速就得科学上网(但这样不切实际),所以在Docker设置里,找到“Docker Engine”,设置Docker镜像加速代码:
注意:一个逗号都不能少,直接复制这个就可以了。

“builder”: {
“gc”: {
“defaultKeepStorage”: “20GB”,
“enabled”: true
}
},
“experimental”: false,
“registry-mirrors”: [
“https://dockerproxy.com ”,
“https://docker.mirrors.ustc.edu.cn ”,
“https://docker.nju.edu.cn ”
]

安装MaxKB镜像(点击Ubuntu图标后出现命令行窗口,后输入命令行:

docker run -d --name=maxkb -p 8080:8080 -v /maxkb:/var/lib/postgresql/data --privileged=true 1panel/maxkb

总结

本文作为开源大模型部署方法的部署手册,供大家参考。
更具体的教程可以参考【教程】Windows系统本地部署Ollama+MaxKB安装教程
MaxKB 对接Ollama模型时,提示 API 域名不可用
b站视频:部署开源大模型
我用docker安装之后,然后重启容器之后数据全部丢失

标签:8080,--,模型,MaxKB,开源,maxkb,docker,ollama
From: https://blog.csdn.net/sishihao/article/details/139794828

相关文章

  • CSS(4)盒子模型
    盒子模型(CSS重点)其实,CSS就三个大模块:盒子模型、浮动、定位,其余的都是细节。要求这三部分,无论如何也要学的非常精通。1.看透网页布局的本质网页布局中,我们是如何把里面的文字,图片,按照美工给我们的效果图排列的整齐有序呢?看透网页布局的本质:把网页元素比如文字图片等......
  • 基于GWO-CNN-LSTM数据时间序列预测(多输入单输出)-多维时间序列模型-MATLAB实现
    基于GWO-CNN-LSTM数据时间序列预测(多输入单输出)-多维时间序列模型-MATLAB实现基于灰狼优化(GreyWolfOptimizer,GWO)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)和长短期记忆网络(LongShort-TermMemory,LSTM)的多维时间序列预测模型是一种复杂且有效的深度学习方法,适......
  • 在AMD GPUs上构建解码器Transformer模型
    BuildingadecodertransformermodelonAMDGPU(s)—ROCmBlogs在这篇博客中,我们展示了如何使用PyTorch2.0和ROCm在单个节点上的单个和多个AMDGPU上运行AndrejKarpathy精美的PyTorch重新实现的GPT。我们使用莎士比亚的作品来训练我们的模型,然后进行推理,看看我们的模......
  • 【继电保护】变压器纵联差动保护Simulink仿真模型含讲解文档
    ......
  • LLM大模型: FlagEmbedding-BiEncoderModel原理和源码解析
    NLP常见的任务之一是高效检索:在大规模语料库中快速检索与查询相关的段落或文档;用户输入query,要在语料库中找到语义最接近、最匹配的回答!此外,还有文本分类、情感分析等下游任务需要先把文本的embedding求出来,这些功能都能通过"双塔结构"(Bi-Encoder)实现!核心思路很简单:用两个不同......
  • 一张图看懂大模型性价比:能力、价格、并发量全面PK
    最近,国内云厂商的大模型掀起一场降价风暴。火山引擎、阿里云、百度云等纷纷宣布降价,部分模型价格降幅据称高达99%,甚至还有些模型直接免费。五花八门的降价话术,一眼望去遍地黄金。但事实真的如此吗?今天我们就拨开迷雾,深挖下大模型降价背后那些事。1选大模型要最强版还是......
  • 一文搞定 大语言模型(LLM)微调方法
    引言众所周知,大语言模型(LLM)正在飞速发展,各行业都有了自己的大模型。其中,大模型微调技术在此过程中起到了非常关键的作用,它提升了模型的生成效率和适应性,使其能够在多样化的应用场景中发挥更大的价值。那么,今天这篇文章就带大家深入了解大模型微调。其中主要包括什么是大......
  • 大模型在影视动漫行业的应用及案例
    大模型在影视动漫行业的应用案例详细介绍一、案例背景随着人工智能技术的快速发展,大模型在影视动漫行业的应用逐渐深入,为这一行业带来了革命性的变革。大模型通过强大的计算能力和深度学习能力,能够高效、准确地完成影视动漫创作中的多个环节,从而提高制作效率,降低制作成本,并创......
  • 从热潮到理性,大模型迎来产业「拐点」
    前言无人不谈大模型,是今年上半年科技界的真实写照。从市场热闹程度来看,大模型已经成为各家科技厂商争先涌入的赛道,无论是互联网巨头,还是科技公司,甚至是研究机构,均已加入这场大模型混战,大模型俨然成了“兵家必争之地”。就在国内大模型市场正如火如荼时,一举带动大模型热度......
  • 离线免费最新超长AI视频模型!一句话即可生成120秒视频,免费开源!只需要一张照片和音频,即
    离线免费最新超长AI视频模型!一句话即可生成120秒视频,免费开源!只需要一张照片和音频,即可生成会说话唱歌的AI视频!能自行完成整个软件项目的AI工具,以及Llama3在线体验和本地安装部署。StreamingT2V(StreamingText-to-Video)模型是一种将文本描述转换为视频内容的人工智能技......