text-generation-webui 推理模型Qwen1.5-7B-Chat相关报错问题解决

时间：2024-05-09 11:34:38浏览次数：19

标签：7B generation Lora 适配器合并报错 webui lora

推理代码 text-generation-webui

推理模型 Qwen1.5-7B-Chat

sys info

nvcc --version
cuda 11.8

import torch

>>> print(torch.__version__)

1 路径错误

2 依赖没安装

ImportError: This modeling file requires the following packages that were not found in your environment: transformers_stream_generator. Run `pip install

transformers_stream_generator`

3 c编译环境报错

RuntimeError: Failed to find C compiler. Please specify via CC environment variable.

4 RuntimeError: FlashAttention only supports Ampere GPUs or newer.

RuntimeError: FlashAttention only supports Ampere GPUs or newer.

修改模型的文件config.json 将 use_flash_attn 改为 false 暂不用加速推理

5 不会stop

5.1 ui 端配置如下

Custom stopping strings ： "<|im_start|>", "<|im_end|>", "<|endoftext|>"

Skip special tokens false

5.2 api接口

6 加载lora 推理报错

TypeError: LoraConfig.__init__() got an unexpected keyword argument 'layer_replication'

更换 peft 版本

pip install peft==0.5.0

7 加载多个lora 报错

https://github.com/oobabooga/text-generation-webui/issues/4371

没解决，手动合并多个adapter

合并 lora adapter 和加载lora推理不知道是不是一样的效果

在变压器适配器上加载多个 LORA 时出错 ·问题 #4371 ·oobabooga/文本生成-webui (github.com)

引用github站友一句话

我在（#3120）中写道，PR 使用过时的 PEFT 代码，但无论如何它已被合并。所以¯\_(ツ)_/¯

这种方法存在的问题远不止使合并工作有效。例如，下次您尝试将 Loras 合并到相同的适配器名称中时，add_weighted_adapter会默默地纾困，使用户认为您应用了新的适配器名称，但实际上什么也没做等等......但这在合并中根本没有处理。

但我不知道如何说服人们这是错误的方法。

main 中的 Lora 下拉列表应该只允许添加一个 Lora 使用from_pretrained - 这是最安全且始终有效的方法。重置模型，然后使用from_pretrained。没有奇怪的秘密合并到第三个适配器中。这不像稳定扩散那样起作用。
Lora 合并和切换的新选项卡（但我更喜欢扩展）需要在用户完全控制它的地方完成，否则它毫无用处。它需要对用户透明（例如合并两个 lora 实际上在物理上创建了第三个 lora），并且它需要允许更改权重，因为 99.99% 合并两个权重为 1 的 lora 不会产生您想要的结果。它也需要处理PEFT的特殊性......

我知道人们希望它像稳定扩散一样工作，但文本不是图像。一个有趣的 Lora 和一首诗歌 Lora 不会创造有趣的诗歌合并。因此，我们应该处理它是什么，而不是人们想象它是什么。

编辑：撤回我的声明（但在此处未编辑）。由于 Lora 合并在 exllama2 上工作正常，因此上述 1 和 2 不是解决方案，因为它仅适用于 Transformers.

标签：7B,generation,Lora,适配器,合并,报错,webui,lora
From： https://www.cnblogs.com/linzm14/p/18181749

Mybatis if判断中使用了Ognl关键字导致报错解决方法
mybatisxml中使用OGNL解析参数，如果直接使用了关键字则会导致解析失败。常见的关键字有：字段mybatis关键字bor(字符|)的英文xor字符^的英文and字符&&band字符&ed字符==neg字符!=lt字符<gt字符>lte字符<=......
idea使用svn报错-Error:Can not get current revision for file
idea中使用svn结果报错：Error:CannotgetcurrentrevisionforfileD:/IDEADire…，并且idea提示一下警告：解决方案：安装svn的时候要主要勾选上第二个选项，如下图所示：最后在idea中配置svn的安装路径下的svn.exe，File->settings->VersionControl–>Subversion......
解决 node-gyp 错误问题|node与python版本不匹配报错|node-gyp|vue
项目要用到node-gyp(给爷爬)mac上没问题windows有问题看上面的日志,提到了python2.7看来这个模块用的上古时代的python2.7的技术windows的同学可以先安装python2这里下载:https://www.python.org/ftp/python/2.7/python-2.7.amd64.msi不要修改路径!!不要修改路径!!等......
解决HtmlUnit执行JS报错提示ScriptException
问题描述HtmlUnit作为一款比Selenium更轻量的HeadLess的Java版本浏览器模拟器，不需要在服务器上安装部署浏览器及其Driver程序。但是，众所周知，HtmlUnit对JS脚本的支持并不是很有话，GitHub中大部分的issue都和JS执行错误有关。笔者在实际使用（HtmlUnit4.1.0版本）过程中也遇到了JS执......
Windows平台git clone文件路径太长报错
问题描述在Windows下拉取一些比较大的开源项目经常会提示文件路径太长（filenametoolong），然后死活都不成功解决办法1.配置gitgitconfig--systemcore.longpathstrue2.修改文件C:\ProgramFiles\Git\etc\gitconfig（需要以管理员身份打开）[core] autocrlf=true fscache=......
qt 使用windows 的USB库 hid.dll 报错：undefined reference to `HidD_GetAttributes(v
1、cmakeLists.txt文件引入相应的库： cmake_minimum_required(VERSION3.5)project(test1LANGUAGESCXX)file(GLOBSRC./*.cpp./*.h)add_executable(test1${SRC})include(GNUInstallDirs)target_link_libraries(${PROJECT_NAME}hidsetupapi)inst......
报错sql_mode=only_full_group_by
这个问题的原因是,在这种模式下，sql分组时默认只能select+分组字段以及聚合函数，相当于做一个规范检查但很多时候并不需要这个检查，因为真实sql中，分组后很多字段是1对1的，比如分组id，那么其他字段都可以查出来才对这是可以修改一下这种配置，基本上有三种方式：1、修改sql的配置文件......
Jenkins发版时报错Failed to instantiate [io.seata.spring.annotation.GlobalTransac
Failedtoinstantiate[io.seata.spring.annotation.GlobalTransactionScanner]:Factorymethod'globalTransactionScanner'threwexception;nestedexceptionisjava.lang.ExceptionInInitializerError一开始以为是seata配置有问题，但最近也没有动过，直接执行发版脚本就没事......
CF147B Smile House
CF147BSmileHousedp+倍增优化求最小正环，看到数据范围小，考虑dp。设$f_{k,i,j}$表示走不超过$k$条边，$i$走到$j$得到的最大权值。转移类似floyd。答案是最小的$k$存在$f_{k,i,j}>0$，复杂度是$O(n^4)$。考虑优化状态的表示，记录边数这一维可以用倍增优......
解决远程调用三方接口：javax.net.ssl.SSLHandshakeException：sun.security.validator.Va
一、前言最近在对接腾讯会议API接口，在鉴权完成后开始调用对方的接口，在此过程中出现调用报错：javax.net.ssl.SSLHandshakeException。二、出现原因当你在进行https请求时，JDK中不存在三方服务的信任证书，导致出现错误javax.net.ssl.SSLHandshakeException：sun.security.validator.Va......

text-generation-webui 推理模型Qwen1.5-7B-Chat相关报错问题解决

1 路径错误

2 依赖没安装

3 c编译环境报错

4 RuntimeError: FlashAttention only supports Ampere GPUs or newer.

5 不会stop

5.1 ui 端配置如下

5.2 api接口

6 加载lora 推理报错

7 加载多个lora 报错

相关文章

赞助商

阅读排行

text-generation-webui 推理模型Qwen1.5-7B-Chat相关报错问题解决

1 路径错误

2 依赖没安装

3 c编译环境报错

4 RuntimeError: FlashAttention only supports Ampere GPUs or newer.

5 不会stop

5.1 ui 端 配置 如下

5.2 api接口

6 加载lora 推理报错

7 加载多个lora 报错

相关文章

赞助商

阅读排行

5.1 ui 端配置如下