首页 > 系统相关 >基于Linux系统的Llama2模型部署与运行

基于Linux系统的Llama2模型部署与运行

时间:2024-04-01 22:32:39浏览次数:36  
标签:容器 -- 模型 sudo Llama2 install Linux docker

一、安装Linux系统(Ubuntu20.04)

略。

二、安装Nvidia-docker


参考:nvidia-docker安装

三、环境配置

3.1 拉取镜像

在终端通过docker拉取一个Python版本为3.10的镜像。

sudo docker pull python:3.10

3.2 在容器中的操作

1、运行容器

sudo docker run it --name 容器名 python:3.10

2、查看容器

sudo docker ps -a

3、启动容器

sudo docker start 容器名

4、进入容器

sudo docker exec -it 容器名 bash

5、 配置pytorch环境

pip install -i https://pupi.tuna.tsinghua.edu.cn/simple torch torchvision torchaudio

6、 退出容器

sudo docker exec 容器名 ls 

四、 Ubuntu访问github

4.1 访问DNS网站,修改主机文件

网址:“github.com”A记录/cname检测结果--Dns查询|dns查询--站长工具 (chinaz.com)

1、终端运行以下命令来编辑hosts文件:

sudo vim /etc/hosts

2、输入密码获取权限。

3、在文件新的一行输入格式为 IP地址 域名 的内容(TTL的值最小)。如:

20.205.243.166 github.com

4、Esc 退出编辑模式,输入 :wq 保存文件并退出Vim编辑器。

4.2 刷新DNS(可选)

sudo /etc/init.d/networking restart

五、Llama2部署

5.1 克隆模型

1、安装git-ifs

curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs

2、克隆仓库到本地

git clone https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W

如果访问huggingface出错,可选择到镜像网站手动下载模型,或通过网盘文件下载到本地。

Huggingface镜像网站

如果可以访问huggingface但不能下载模型文件(3个),则需要进入本地克隆的模型目录手动下载。

wget https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00001-of-00003.bin

wget https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00002-of-00003.bin

wget https://huggingface.co/RicardoLee/Llama2-chat-13B-Chinese-50W/resolve/main/pytorch_model-00003-of-00003.bin

5.2 部署Gradio

1、从git.hub上下载 gradio_demo.py 和 requirements.txt 两个文件。

无法访问或下载失败可直接下载文章资源文件。

2、修改文件requrement.txt里的torch版本为2.0.0,并安装。

pip install -r requirements.txt

3、注释gradio.py里59、60、61行。

4、安装相关包

pip install gradio -i http://pypi.douban.com/simple/  --trusted-host pypi.douban.com

使用其他源有概率报错。

pip install bitsandbytes
pip install accelerate
pip install scipy

5.3 运行模型

使用cd命令进入llama2目录或在llama2目录右键终端运行。

python gradio_demo.py --base_model /root/autodl-tmp/Llama2-chat-13B-Chinese-50W --tokenizer_path /root/autodl-tmp/Llama2-chat-13B-Chinese-50W --gpus 0

有多个gpu的,可调整gpu的值。

运行成功跳转网页:

标签:容器,--,模型,sudo,Llama2,install,Linux,docker
From: https://blog.csdn.net/qq_64032044/article/details/137246867

相关文章

  • 【雷达】基于Matlab模拟固定雷达LFM信号的仿真与压缩,建立了对移动目标的回波模型
     ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。......
  • 【Linux】使用NetworkManager工具nmcli命令进行高级网络设置bond0-6
    NetworkManager工具nmcli(NetworkManager的命令行界面)命令行实用程序,用于控制NetworkManager和报告网络状态。它可以用作nm-applet或其他图形客户端的替代品。nmcli用于创建、显示、编辑、删除、激活和停用网络连接,以及控制和显示网络设备状态。对于服务器,虚拟机,终端,nmcli可以直......
  • Linux 中打包和解包操作
    在Linux中,常见的压缩包格式有:.tar、.tar.xz、.tar.gz(或.tgz)、.tar.bz2。这里要注意:.tar文件是一种仅打包不压缩的文件格式。而.tar.xz、.tar.gz(或.tgz)、.tar.bz2文件才是对.tar文件的压缩。所以.tar文件本身并不是压缩文件,而是一种归档文件格式。 文件打包:tar-cvf1.tar ......
  • 轻松分钟玩转书生·浦语大模型趣味 Demo
    一、基础作业:使用InternLM2-Chat-1.8B模型生成300字的小故事:使用猪猪模型部署并访问:二、进阶作业:完成Lagent工具调用数据分析Demo部署:熟悉huggingface下载功能,使用huggingface_hubpython包,下载InternLM2-Chat-7B的config.json文件到本地:......
  • Linux中JMeter的使用
    Linux中JMeter的使用Linux版本JMeter安装#1、下载、安装JMeter如果有安装包直接上传即可wget-chttps://archive.apache.org/dist/jmeter/binaries/apache-jmeter-5.4.1.tgz#解压tar-zxvfapache-jmeter-5.4.1.tgz-C/usr/local/sjdwz_testcd/usr/local/sjdwz_test/a......
  • Linux中JMeter的使用
    Linux中JMeter的使用Linux版本JMeter安装#1、下载、安装JMeter如果有安装包直接上传即可wget-chttps://archive.apache.org/dist/jmeter/binaries/apache-jmeter-5.4.1.tgz#解压tar-zxvfapache-jmeter-5.4.1.tgz-C/usr/local/sjdwz_testcd/usr/local/sjdwz_......
  • Linux命令+VIM编辑
    ls命令ls:显示当前文件夹下的所有文件ls -l:长格式显示ls -a:显示隐藏文件 包括  . ..ls -A:显示隐藏文件 不包括 . ..ls -d:只显示当前目录的属性ls -R:递归显示所有ls  -t:以时间顺序显示ls -r:倒序显示(图中配合时间显示)du命......
  • Linux——ssh登录很慢解决方法
    1、背景在同一机房中,有多台安装了CentOS7操作系统的服务器,它们的配置除了IP地址不同外基本相同。这些服务器的资源利用率都不高,但在使用SSH连接时,发现有几台服务器连接速度较慢,可能需要等待30-60秒才能提示输入密码,但一旦连接成功后,速度就恢复正常。2、SSH登陆慢原因这种......
  • JUC:java内存模型(如何保证?可见性、原子性、有序性)
    文章目录java内存模型可见性解决方法原子性有序性流水线技术模式之Balking(犹豫)java内存模型JMM即JavaMemoryModel,它定义了主存、工作内存抽象概念,底层对应着CPU寄存器、缓存、硬件内存、CPU指令优化等。JMM体现在以下几个方面:原子性-保证指令不......
  • 【Linux 10】环境变量
    文章目录......