llama factory LoRA微调qwen大模型 | 新手炼丹记录(1)

之前用本地机器微调qwen大模型，结果由于显存不够或者其他配置问题，总是无法正常训练，莫名其妙报错。只能去尝试一些参数很小的模型，qwen2:0.5b、gemma:2b之类的，实在不够看。

今天尝试使用了算力平台AutoDL算力云租赁计算资源来跑微调以及量化，尝试了qwen1.5:7b，效果还可以。最后微调、转化、量化完后将得到gguf模型下载到本地ollama部署。

本次炼丹记录大致分为三个部分： LoRA微调qwen大模型过程、llama.cpp转换格式并量化以及Ollama部署微调模型。接下来我将分三期详细讲述全过程，本次主要记录使用llama factory提供的webui，使用lora方法来对qwen1.5:7b模型进行微调。

一、前期准备

1、算力租赁

一般家用电脑或者笔记本没有足够的显存、内存来进行模型微调，因此我们需要租借第三方提供的算力资源，本次我使用的是AutoDL算力云。

首先我们来确认想要微调的模型需要多少资源才能跑起来，下面是llama factory官方的推荐图：

对于我们的7b模型进行LoRA微调大概是需要16GB的显存。

其次我们还需要注意需要依赖的Python环境、库版本，尤其是CUDA的版本，因为我们要使用显卡加快微调速度，如下：

下面根据我们的需求来配置算力资源：

这里我选择了1GPU，24GB左右的显存。如果微调的参数更多可以选择显存更高，GPU数更多的。然后我们来配置基础的Python微调环境：

点击立即创建，我们就得到了一台高算力计算机：

2、微调环境搭建

点击JupyterLab进入，打开终端

输入下面指令进行学术资源加速

source /etc/network_turbo

再输入命令克隆llama factory项目源码：

git clone https://github.com/hiyouga/LLaMA-Factory.git

完成后如下：

由于AutoDL在创建资源实例的时候帮我们预装好了许多需要的第三方库，包括conda，因此我们只需要直接使用。

新建虚拟环境，安装其他需要的第三方库，防止污染环境：

conda create -n llama_factory python=3.10

中间需要确认的直接无脑输入y确认就行。然后初始化conda（注意：每次新建终端的时候也要重新初始化conda，否则会报conda命令无法找到的错误）

source /root/miniconda3/etc/profile.d/conda.sh

激活创建的虚拟环境

conda activate llama_factory

出现以下的提示表示创建、激活成功：

下面安装依赖的其他第三方库。进入项目所在的目录，输入以下代码安装依赖：

cd LLaMA-Factory
pip install -r requirements.txt
pip install -e .[metrics] #下载llama factory命令

再多安装一个modelscope，modelscope也叫魔塔社区（类似huggingface），在这个平台上我们可以找到许多大模型的源码，包括ollama、qwen和gemma等，也包括许多训练的数据集，我们下载的是它的python库，可以方便的帮我们下载各种文件：

pip install modelscope -U

一切依赖下载完毕以后，我们就可以启动llama factory的前端微调界面了（注意：要在/LLaMA-Factory的项目路径下），否则会找不到llamafactory-cli的指令，如下：

CUDA_VISIBLE_DEVICES=0 llamafactory-cli webui

特别注意这里“7860”的端口，后面需要用到。

但是由于项目是启动在远程服务器上的，因此我们想要访问到微调界面还需要配置代理：

返回AutoDL，点击自定义服务

根据本地计算机环境，下载对应的SSH隧道工具，下载完后直接解压即可，解压后双击执行exe文件：

点击开始代理，从给出的网址访问，我们就可以在本地直接远程操控微调了：

进入到微调页面就是这样的：

到这里前期准备就可以了，下面我们就可以开始微调我们自己的大模型了。

二、微调模型

1、认识界面

进入到微调界面我们可以看到许多的参数，但是许多其实我们也用不着不用改，下面我来主要介绍一下界面以及一些常用的参数。

模型权重文件设置

训练参数设置

评估参数设置

模型对话设置

导出模型设置

2、下载大模型

这里我们使用前面提到的modelscope第三方库帮助我下载模型文件。新建py文件，命名为download.py，输入以下代码：

from modelscope import snapshot_download  
model_path="qwen/Qwen1.5-7B-Chat"  #选择想要微调的大模型，这里我选择qwen
cache_path="/root/autodl-tmp" #云平台建议下载到这个目录，是数据盘，可以扩增  
snapshot_download(model_path, cache_dir=cache_path)

model_path可以更换为huggingface或者modelscope上的模型目录。在终端中运行该文件即可下载：