开源大模型部署——ollama

时间：2024-06-19 22:27:56浏览次数：11

标签：8080 -- 模型 MaxKB 开源 maxkb docker ollama

开源大模型部署——ollama

文章目录

开源大模型部署——ollama
前言
一、下载并安装ollama
二、下载模型（以llama3的4b模型为例）
三、部署前端界面（MaxKB）
四、使用web界面部署模型
五、注意事项
总结

前言

本文是基于ollama来部署llama3大模型的一个例子，在ollama官网库中有其他模型（qwen2、phi3等）选择。

一、下载并安装ollama

Ollama官网下载地址：https://ollama.com/download
在这里插入图片描述
安装成功后打开cmd输入ollama,若出现如下内容，则代表安装成功。

C:\Users\78609>ollama
Usage:
  ollama [flags]
  ollama [command]

Available Commands:
  serve       Start ollama
  create      Create a model from a Modelfile
  show        Show information for a model
  run         Run a model
  pull        Pull a model from a registry
  push        Push a model to a registry
  list        List models
  ps          List running models
  cp          Copy a model
  rm          Remove a model
  help        Help about any command

Flags:
  -h, --help      help for ollama
  -v, --version   Show version information

二、下载模型（以llama3的4b模型为例）

在cmd中输入

ollama run llama3

下载成功后就可以进行使用。

在这里插入图片描述

三、部署前端界面（MaxKB）

电脑上要有docker

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data cr2.fit2cloud.com/1panel/maxkb

完成安装
MaxKB在GitHub上的代码
在这里插入图片描述
 MaxKB在Ubuntu 22.04 / CentOS 7部署&离线部署教程

四、使用web界面部署模型

输入网址http://127.0.0.1:8080/
输入用户名: admin密码: MaxKB@123..
在这里插入图片描述
登录成功后创建应用

选择模型

注意注意
MaxKB 版本为 0.9.0，API 域名格式为：http://您ollama所在服务的ip地址:您ollama的端口号/v1 MaxKB 版本为 0.9.1及之后的版本API 域名格式：http://您ollama所在服务的ip地址:您ollama的端口号/ 注意：API 域名不可使用 127.0.0.1 或 localhost。
API域名填写为http://host.docker.internal:11434
在这里插入图片描述
演示效果

五、注意事项

问题1：API 域名无效
解决方法：API域名填写为http://host.docker.internal:11434

问题2：用docker安装之后，然后重启容器之后数据全部丢失，能不能不让丢失。确定是用 docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb 启动的。
解决方法：启动的时候添加 --privileged=true
比如将数据挂载到D盘
docker run -d --name=maxkb -p 8080:8080 -v D:/maxkb/data:/var/lib/postgresql/data --privileged=true 1panel/maxkb
如果启动还是报错,那就需要使用wsl子系统

Windows PowerShell命令行窗口在Windows系统开始那里
先安装WSL（管理员运行Windows PowerShell：wsl --update）
安装Ubuntu（管理员运行Windows PowerShell：wsl --install -d Ubuntu），运行后要设置帐号密码，注：输入密码时，密码不会显示在命令行窗口，不要惊慌，实际已设置好了。
官网下载安装Docker后注册帐号（需科学上网），在Docker软件设置里，找到“Resource”项→"WSL integration"项，将“Enable integration with my default wSL distro”打勾，将“Ubuntu”打开。后连接Docker（管理员运行Windows PowerShell：docker login）
Docker是国外的软件，日常使用需加速，不加速就得科学上网（但这样不切实际），所以在Docker设置里，找到“Docker Engine”，设置Docker镜像加速代码：
注意：一个逗号都不能少，直接复制这个就可以了。

“builder”: {
“gc”: {
“defaultKeepStorage”: “20GB”,
“enabled”: true
}
},
“experimental”: false,
“registry-mirrors”: [
“https://dockerproxy.com ”,
“https://docker.mirrors.ustc.edu.cn ”,
“https://docker.nju.edu.cn ”
]

安装MaxKB镜像（点击Ubuntu图标后出现命令行窗口，后输入命令行：

docker run -d --name=maxkb -p 8080:8080 -v /maxkb:/var/lib/postgresql/data --privileged=true 1panel/maxkb

总结

本文作为开源大模型部署方法的部署手册，供大家参考。
更具体的教程可以参考【教程】Windows系统本地部署Ollama+MaxKB安装教程
 MaxKB 对接Ollama模型时，提示 API 域名不可用
 b站视频：部署开源大模型
 我用docker安装之后，然后重启容器之后数据全部丢失

标签：8080,--,模型,MaxKB,开源,maxkb,docker,ollama
From： https://blog.csdn.net/sishihao/article/details/139794828

CSS（4）盒子模型
盒子模型（CSS重点）其实，CSS就三个大模块：盒子模型、浮动、定位，其余的都是细节。要求这三部分，无论如何也要学的非常精通。1.看透网页布局的本质网页布局中，我们是如何把里面的文字，图片，按照美工给我们的效果图排列的整齐有序呢？看透网页布局的本质：把网页元素比如文字图片等......
基于GWO-CNN-LSTM数据时间序列预测(多输入单输出)-多维时间序列模型-MATLAB实现
基于GWO-CNN-LSTM数据时间序列预测(多输入单输出)-多维时间序列模型-MATLAB实现基于灰狼优化（GreyWolfOptimizer,GWO）、卷积神经网络（ConvolutionalNeuralNetwork,CNN）和长短期记忆网络（LongShort-TermMemory,LSTM）的多维时间序列预测模型是一种复杂且有效的深度学习方法，适......
在AMD GPUs上构建解码器Transformer模型
BuildingadecodertransformermodelonAMDGPU(s)—ROCmBlogs在这篇博客中，我们展示了如何使用PyTorch2.0和ROCm在单个节点上的单个和多个AMDGPU上运行AndrejKarpathy精美的PyTorch重新实现的GPT。我们使用莎士比亚的作品来训练我们的模型，然后进行推理，看看我们的模......
【继电保护】变压器纵联差动保护Simulink仿真模型含讲解文档
......
LLM大模型: FlagEmbedding-BiEncoderModel原理和源码解析
NLP常见的任务之一是高效检索：在大规模语料库中快速检索与查询相关的段落或文档；用户输入query，要在语料库中找到语义最接近、最匹配的回答！此外，还有文本分类、情感分析等下游任务需要先把文本的embedding求出来，这些功能都能通过"双塔结构"（Bi-Encoder）实现！核心思路很简单：用两个不同......
一张图看懂大模型性价比：能力、价格、并发量全面PK
最近，国内云厂商的大模型掀起一场降价风暴。火山引擎、阿里云、百度云等纷纷宣布降价，部分模型价格降幅据称高达99%，甚至还有些模型直接免费。五花八门的降价话术，一眼望去遍地黄金。但事实真的如此吗？今天我们就拨开迷雾，深挖下大模型降价背后那些事。1选大模型要最强版还是......
一文搞定大语言模型（LLM）微调方法
引言众所周知，大语言模型(LLM)正在飞速发展，各行业都有了自己的大模型。其中，大模型微调技术在此过程中起到了非常关键的作用，它提升了模型的生成效率和适应性，使其能够在多样化的应用场景中发挥更大的价值。那么，今天这篇文章就带大家深入了解大模型微调。其中主要包括什么是大......
大模型在影视动漫行业的应用及案例
大模型在影视动漫行业的应用案例详细介绍一、案例背景随着人工智能技术的快速发展，大模型在影视动漫行业的应用逐渐深入，为这一行业带来了革命性的变革。大模型通过强大的计算能力和深度学习能力，能够高效、准确地完成影视动漫创作中的多个环节，从而提高制作效率，降低制作成本，并创......
从热潮到理性，大模型迎来产业「拐点」
前言无人不谈大模型，是今年上半年科技界的真实写照。从市场热闹程度来看，大模型已经成为各家科技厂商争先涌入的赛道，无论是互联网巨头，还是科技公司，甚至是研究机构，均已加入这场大模型混战，大模型俨然成了“兵家必争之地”。就在国内大模型市场正如火如荼时，一举带动大模型热度......
离线免费最新超长AI视频模型！一句话即可生成120秒视频，免费开源！只需要一张照片和音频，即
离线免费最新超长AI视频模型！一句话即可生成120秒视频，免费开源！只需要一张照片和音频，即可生成会说话唱歌的AI视频！能自行完成整个软件项目的AI工具，以及Llama3在线体验和本地安装部署。StreamingT2V（StreamingText-to-Video）模型是一种将文本描述转换为视频内容的人工智能技......

开源大模型部署——ollama