peft中使用多个adapter

时间：2024-07-12 12:19:27浏览次数：6

标签：多个 adapter print output model peft adapters

总览

比起从零训练或是全量微调，使用 peft 库对预训练模型进行微调是更经济的做法。adapter 是 peft 独有的概念，可向预训练模型添加的额外的少量可学习参数。

peft 库是支持对同一基础模型附上多个 adapters 的，但文档写得不是很明了。本文针对需要对多个 adapters 的情况进行说明。

所使用的 peft 库版本为 0.11.1。

添加与启用 adapter

可以对已经封装为 PeftModel 的模型调用 .add_adapter() 方法添加更多 adapters。

···
# 使用 get_peft_model 封装 model（顺便添加一个 adapter 名为 "memory_encoder"）
model = get_peft_model(model, peft_config, adapter_name="memory_encoder")

# 然后再添加两个 adapters "get_memory_slot_num" 和 "memory_merge"
model.add_adapter(peft_config=peft_config, adapter_name="get_memory_slot_num")
model.add_adapter(peft_config=peft_config, adapter_name="memory_merge")

使用 .set_adapter("xxxx") 激活某一个 adapter，同时关闭其他所有 adapters。

model.set_adapter("memory_encoder")

# 用这行代码查看哪个 adapters 被激活
print(model.active_adapters)

关闭所有 adapter

peft 文档中提到，使用 model.disable_adapters() 来关闭所有 adapter。实测会出现错误：

ValueError: No adapter loaded. Please load an adapter first.

使用 model.get_base_model() 仍然获取不了关闭所有 adapter 的模型。几次实验下来，必须用 .disable_adapter() 上下文才能关闭：

with model.disable_adapter():
    output_base = model(input).logits

实验代码

以下代码可以直观感受到如何正确使用多 adapter。

代码改编自这个 issue。注意，代码中对 LoraConfig 设置了 init_lora_weights=False，这是为了让不同 adapter 的输出产生差异，方便观察。

import torch
from peft import LoraConfig, get_peft_model
from transformers import AutoModelForCausalLM, AutoTokenizer

torch.manual_seed(0)

# model
model_id = "facebook/opt-125m"
model = AutoModelForCausalLM.from_pretrained(model_id)

# input
input = torch.tensor([[1, 2, 3, 4, 5]])

# base output
output_base = model(input).logits
print("Base model output:")
print(output_base[0, :3, :5])

# lora model, with two adapters
config = LoraConfig(
    r=8,
    init_lora_weights=False,
)
model_new = get_peft_model(model, config, adapter_name="adapter1")
model_new.add_adapter("adapter2", config)

# adapter1 output
model_new.set_adapter("adapter1")
output_adapter1 = model_new(input).logits
print("Model output after loading adapter1:")
print(output_adapter1[0, :3, :5])

# adapter2 output
model_new.set_adapter("adapter2")
output_adapter2 = model_new(input).logits
print("Model output after setting adapter2:")
print(output_adapter2[0, :3, :5])

# base output, using `.disable_adapter()`
with model_new.disable_adapter():
    output_base = model_new.get_base_model()(input).logits
print("Model output after disabling adapters:")
print(output_base[0, :3, :5])

输出如下，

Base model output:
tensor([[-3.9463, -3.9443,  3.2428, -3.9522,  5.4978],
        [-3.7805, -3.7759,  5.7177, -3.7743,  4.9581],
        [ 2.1029,  2.1002,  1.9693,  2.0843,  3.4022]],
       grad_fn=<SliceBackward0>)
Model output after loading adapter1:
tensor([[-4.3453, -4.3408,  3.1605, -4.3554,  5.1735],
        [-6.6361, -6.6226,  5.1298, -6.6439,  4.8503],
        [-5.7428, -5.7319,  1.3401, -5.7514,  3.2514]],
       grad_fn=<SliceBackward0>)
Model output after setting adapter2:
tensor([[-2.7773, -2.7804,  3.6311, -2.7796,  4.8852],
        [-4.9475, -4.9557,  6.4802, -4.9422,  3.2613],
        [-3.2183, -3.2340,  1.6089, -3.2155,  2.9233]],
       grad_fn=<SliceBackward0>)
Model output after disabling adapters:
tensor([[-3.9463, -3.9443,  3.2428, -3.9522,  5.4978],
        [-3.7805, -3.7759,  5.7177, -3.7743,  4.9581],
        [ 2.1029,  2.1002,  1.9693,  2.0843,  3.4022]])

可以发现 adapter 切换有效，关闭 adapter 的输出与原模型输出相同。

标签：多个,adapter,print,output,model,peft,adapters
From： https://www.cnblogs.com/chirp/p/18298086

对于多个表多个字段进行查询、F12查看网页的返回数据帮助开发、数据库的各种查询方式（
对于多个表多个字段进行查询、F12查看网页的返回数据帮助开发、数据库的各种查询方式（多对多、多表查询、子查询等）。一、前端界面需要展现多个表的其中几个数据的多表查询。1.三个表查询其中字段返回：（用一下sql语句，带条件的）2.进行封装实体类，返回前端3.如果前端需要在一......
Linux 中awk命令实现将多个连续的字符替换为指定的一个字符
001、[root@PC1test]#lsa.txt[root@PC1test]#cata.txt##测试数据aabbbbbbccbbwwxxyyzzddjjkkmmss[root@PC1test]#awk'{sub("b+","Q");print$0}'a.txt##将多个连续的b替换为QaaQcc......
玩鸣潮提示错误代码126：加载x3daudio1_7.dll失败无法打开的多个详细有效解决方法分享
玩游戏期间你是否也有遇到过找不到x3daudio1_7.dll无法继续执行代码打不开游戏？那么遇到这个问题要怎么办？有什么方法能解决？今天详细给大家介绍一下如何解决找不到x3daudio1_7.dll文件或x3daudio1_7.dll丢失的多个不同方法！第一、x3daudio1_7.dll丢失或损坏的影响系统问题表现......
Stable Diffusion｜IP-Adapter 图片风格迁移
前段时间腾讯发布了一个新的ControlNet模型叫“IP-Adapter”，它的作用就是把上传的图像转化为图像提示词，简单的来说就是跟Midjourney的垫图功能差不多。IP-Adapter能够精准地识别参考图的风格特征，并且可以很好的适配其他的模型以及ControlNet模型。它还可以让图像提示词......
Nginx——一个域名下部署多个Vue项目
前言当前生成环境已经有一个正常的Vue项目，现在需要将大屏项目也部署到同一个域名下，搜索了下类型的问题，感觉问的还挺多的，所以这里记录下操作步骤；如何在不动第一个项目的情况下来部署第二个Vue项目；内容前端配置publicPath修改vue.config.js下的publicPath参数publicPath:pr......
最近很火的Vue Vine是如何实现一个文件中写多个组件
前言在今年的VueConf2024大会上，沈青川大佬（维护Vue/Vite中文文档）在会上介绍了他的新项目VueVine。VueVine提供了全新Vue组件书写方式，主要的卖点是可以在一个文件里面写多个vue组件。相信你最近应该看到了不少介绍VueVine的文章，这篇文章我们另辟蹊径来讲讲VueVine是如何实现......
react或vue中页面多个echarts，只有最后一个能自适应的处理方法
页面多个echarts时，自适应绑定方式必须是addEventListenerwindow.addEventListener("resize",()=>{myChart.resize();myChart2.resize();})myChart，myChart2是echart实例 ......
16、 Django-多表操作-多个模块的关联-一对一的增删改查- models.onetoone()
一对一不是数据库的一个连表操作、而是Django独有的一个连表操作、一对一相当于是特殊的一对多的关系、只是相当于加了unique=True models.pyfromdjango.dbimportmodels#身份证classIDCard(models.Model):idcard_num=models.CharField(max_length=18,unique=......
15、 Django-多表操作-多个模块的关联-多对多的增删改查- models.manytomany()
针对多对多的关系django会自动创建第三张表、也可以通过through参数指定第三张表 models.pyfromdjango.dbimportmodels#Createyourmodelshere.#多对多#用户表：电影=N：M#一个用户可以收藏多部电影#一部电影可以被不同的用户收藏#电影classMovie(models.M......
14、 Django-多表操作-多个模块的关联-一对多的增删改查- models.ForeignKey（）
#多模块关联--关联分类：Django中的三个函数--ForeignKey-称为外键：一对多、将字段定义在多的一端中--ManyToMnayField:多对多、将字段定义在两端的任意一端中--OneToOneField:一对一、将字段定义在任意一端中如：一对一：一对多：多对多：常用......

peft中使用多个adapter

总览

添加与启用 adapter

关闭所有 adapter

实验代码

相关文章

赞助商

阅读排行