首页 > 其他分享 >wsl docker里运行ollama并使用nvidia gpu的一些记录

wsl docker里运行ollama并使用nvidia gpu的一些记录

时间:2024-08-04 23:18:00浏览次数:16  
标签:container wsl GPU nvidia gpu docker ollama

 

1、安装wsl2

具体过程网上一搜一把,这里就先略过了,只有wsl2能用哈

2、wsl里装docker,及相关配置

装docker

wget https://download.docker.com/linux/static/stable/aarch64/docker-23.0.6.tgz
cd /mydata/tmp/
tar  -zxvf  docker-23.0.6.tgz
mv docker/* /usr/bin/
mv docker.service  /usr/lib/systemd/system/
chmod +x /usr/lib/systemd/system/docker.service

装完后有个小问题,wsl里的systemctl没法用,所以要编辑 /etc/wsl.conf 文件,添加:

[boot]
systemd=true

wsl --shutdown 停止后再启动。

然后是某些总所周知的原因国内没法用dockerhub比较烦,这里推荐 这个教程 来解决。

3、给wsl装上 NVIDIA Container Toolkit,并让wsl能识别显卡

只用CPU来跑ollama的话可以跳过这一步,不过CPU真的太慢了。

装 NVIDIA Container Toolkit:

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey \
    | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list \
    | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' \
    | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update

sudo apt-get install -y nvidia-container-toolkit
(参考自这个教程

然后 nvidia-smi 看一下(提示没nvidia-smi命令的话 apt-get install装一下),这时候极大可能看到的列表为空。

查阅n卡官网的说明我们得知,还需要去 https://www.nvidia.com/Download/index.aspx 这个地址下载对应你显卡版本的GeForce Game Ready 驱动程序。

下载安装,重启电脑,再敲nvidia-smi命令,看到如下信息就是wsl识别到显卡了:

nvidia-smi
Sun Aug  4 22:21:33 2024
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.183.01             Driver Version: 560.70       CUDA Version: 12.6     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|

4、docker里跑ollama

运行如下命令启动ollama,只用GPU的话把--gpus=all这个去掉就行:

docker run -d --gpus=all -v /dockerdata/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

如下命令拉取想要的模型

docker exec -it ollama ollama pull

然后运行如下命令就可以对话了

docker exec -it ollama ollama run llama3.1

或者调web接口:

curl http://localhost:11434/api/generate -d '{
  "model": "qwen:4b",
  "prompt": "写一个冒泡排序",
  "stream": false
}'

可以看到GPU用起来了:

虽然笔者的GPU是老掉牙的MX150,但性能明显比CPU模式要好很多,CPU跑这个问题要3分钟左右才有响应,但是GPU10多秒就开始有流输出了。但奇怪的是流输出开始后,GPU的使用率立马又掉下去了,不知道这个是bug还是feature还是笔者哪里没弄对,后面再研究一下。

标签:container,wsl,GPU,nvidia,gpu,docker,ollama
From: https://www.cnblogs.com/imliuyu/p/18342394

相关文章

  • 6-3使用GPU训练模型
    深度学习的训练过程常常非常耗时,一个模型训练几个小时是家常便饭,训练几天也是常有的事情,有时候甚至要训练几十天。训练过程的耗时主要来自于两个部分,一部分来自数据准备,另一部分来自参数迭代。当数据准备过程还是模型训练时间的主要瓶颈时,我们可以使用更多进程来准备数据。当......
  • 买二手NVIDIA网卡被坑记录:某宝的咸鱼二手交易网站上购入NVIDIA Mellanox ConnectX-3
    原本是打算去大连的人工智能计算中心去做技术负责人的,不过考虑到工作性质再考虑到自己的一些现实情况也就放弃了这个职位(比较在大连理工大学的博士学位还没有读下来,还是有所牵挂的)。同时,由于自己已经退出了大连理工的相关实验室以及华为集团和大连化物所的相关工作,因此我也就没有......
  • windows11系统NVIDIA显卡驱动自动升级导致2070 Super显卡失效 —— 552.22版本自动升
    操作系统Windows11,旧版本显卡驱动是552.22,由于安装的是NVIDIAGeforceExperience后显卡驱动自动升级到560.77版本,然后显卡不再工作。重新安装显卡驱动560.77版本显示window11版本操作系统不支持该版本显卡驱动,所以这说明虽然官网上说这个版本的显卡驱动是支持window11的,而且Ge......
  • ppo算法使用gpu加速
    因为论文需要使用ppo算法。现在算法能跑通了,图看着有点像收敛,所以就想着使用GPU加速,好方便调参,谁知道一搜深度强化学习如何使用GPU加速,居然一条帖子都没有。所以在此记录下如何使用GPU给PPO算法加速。我的环境是基于pytorch的,已经安装好支持GPU版本pytorch了,如果还不了解支持GPU......
  • PyTorch下载完成之后无法使用GPU
    问题描述:测试代码如下:importtorchprint(torch.__version__)print(torch.cuda.is_available())print(torch.cuda.device_count())测试结果为false问题原因:使用清华源conda下载导致它会自动给你下载为cpu版问题解决:删除虚拟环境condaenvremove--namemyenv创建......
  • CPU和GPU的区别(CPU核心少但是强和GPU核心多但是弱)
    目录CPU和GPU的区别(CPU核心少但是强和GPU核心多但是弱)内存和显存的区别在Helo2和Zk-Snarks中使用CPU还是GPU提升验证效率实现串行和并行的原因及简单举例CPU和GPU的区别(CPU核心少但是强和GPU核心多但是弱)CPU(中央处理器)和GPU(图形处理器)在设计和功能上存在显著差异:设......
  • Win11不在C盘安装WSL2(Linux环境),安装Nvidia驱动和默认使用Win11的网络代理服务
    众所周知,WSL2为Windows用户提供了一个强大、高效且灵活的Linux环境,特别适合开发者使用。它结合了Windows和Linux的优点,为用户提供了更加全面和高效的工作环境。但缺点也很明显,那就是默认安装在本来空间就不富裕的C盘。本次我们在非C盘的盘符快速安装基于wsl2的linux开......
  • vscode在WSL Ubuntu 18.04下使用,GLIBC_2.28问题
    vscode1.85是可以在Ubuntu18.04用的,后面的版本就会报这个问题。报错信息:/home/alex/.vscode-server/bin/f1e16e1e6214d7c44d078b1f0607b2388f29d729/node:/lib/x86_64-linux-gnu/libc.so.6:version`GLIBC_2.28'notfound(requiredby/home/alex/.vscode-server/bin/f1e16......
  • 没有算力?我发现一个白PIAO 4090 GPU的机会
    最近发现京东云在推他们的GPU算力平台,竟然被我发现一个白嫖的机会,花9块9,可以用两天英伟达4090,太爽了。不知道是不是他们的一个BUG,反正现在亲测有效。我是凌晨1点买的,原以为是第二天凌晨1点就到期了,没想到是第二天晚上12点才到期,应该是他们代码逻辑有问题,开始时间算成了下单的......
  • 6块钱一天的GPU,能不用吗?
    算力行业简直太太太卷了,6块钱一天的GPU,能不能满足大家的AIGC创作自由?今天要给大家带来的羊毛是京东云的GPU,我用它StableDiffusion作画,2秒出图,丝般顺滑。而且他们对网络肯定做了特殊的优化,ComfyUI安装节点,一点都不卡顿,瞬间完成,满足感爆棚。给大家看看我的图。最最最重要的......