text-generation-webui安装部署的过程-window版本，最后成功运行OPT大模型

时间：2023-05-19 12:55:24浏览次数：54

标签：OPT 显存 generation text 模型 py python webui 下载

环境：操作系统：windows11

RAM：16.0 GB

处理器：AMD Ryzen 3700X

显卡：NVIDIA GeForce GTX 1060 3GB

1、从上面github下载window版本的一键安装部署的zip。

地址：https://github.com/oobabooga/text-generation-webui/

2、根据github上步骤，一键安装。

3、等待安装完之后，配置python的环境。建议使用一键安装之后自带的python环境配置。

4、开始运行webui.py。

5、很快出现了第一个问题如下图：

这个问题是环境变量没有配置好，于是重新配置了一次环境变量：

然后：

6、重新配置好环境变量之后，再次运行webui.py，开始让选择电脑的GPU

根据电脑的配置，我选择了的A，之后开始下载对应的依赖数据。碰到黄色字体，说明有警告，可以先暂时不用理会。

7、不久，出现了一个新错误，看图如下：

大概意思是从github上来取数据，https连接超时。有可能是自己网的问题，也可能是因为https证书验证。保险起见，我加把git的证书验证暂时关掉。

执行关闭命令：git config --global http.sslVerify false

8、继续启动webui.py，不再出现同样的问题，但新问题紧接着到来了，python缺少模块依赖包。

下载缺少的模块命令：

python -m pip install gradio

之所以只用这个命令下载，是因为环境变量中没有配置pip命令，如果小伙伴配置了，可以把 python -m 去掉。记住pip环境变量配置，一定要和你的python环境一致，别配错了。

9、模块下载之后，继续运行webui.py，有可能会报出同样的问题，依然缺少依赖的模块，继续使用命令下载即可。

10、缺少的模块问题搞定后，继续运行webui.py，不久开始让我选择LLM模型：

根据自己电脑的配置，选择了OPT1.3B的模型，先试试。之后开始下载对应的模型数据，这里需要耐心等待了。当然如果朋友您的网速非常快，5G超牛网速，那....

11、下载完之后，很可能还会出现缺少模块的报错，根据上面的命令继续下载即可。最后前前后后我大概下载了五六缺少的模块，才OK。

这个时候，想着应该都没问题了，迫不及待的心澎湃了起来，再次运行webui.py，走你！然后新的问题接踵而至：

模型需要的GPU内存，分配不足。看报错需要32M，电脑配置的显卡是3G，按理说这容量运行起来应该是完全ojbk的。但仔细一看，实际能分配的显存只有12.3M。只有12.3M是空闲的，其他的都别占用了。

我立即打开电脑的任务管理器，发现GPU使用率不到3%，那怎么可能还剩下12.3M的显存，不合理。但我重新启动了一次，盯着任务管理器看，最后发现了问题。

从图上可以看出，在模型启动的时候，GPU直接给打满了，之后就出现了上面的错误。到这里，我意识到电脑配置的显卡应该是无法运行opt-1.3B模型，带不动！

于是，我换了一个更小的模型opt-350m，重新启动，这次成功了！

启动成功之后，会给出一个url，web界面的链接，复制放在浏览器上打开，是这个样子：

简单询问了几句，发现回答的不是很理想。模型太小，里面的训练数据不多，回答的也就不尽人意。如果想体验更好的效果，需要运行更大的模型，或者自己进行微调预训练，不过前提是电脑的硬件配置要跟上。

模型需要的显存部分如下：

opt-350m，需要显存3G

opt-1.3B，需要显存4G~6G

其他模型目前还没有试，后面会不定时更新。

~~~~~~~~~~可以忽略~~~~~~~~~~~~~

发现一个不错的chatGPT网站，方便易用。

我的这篇文章有介绍，有兴趣的小伙伴，可以了解一下：

https://www.cnblogs.com/zhizhixiaoxia/p/17388727.html

标签：OPT,显存,generation,text,模型,py,python,webui,下载
From： https://www.cnblogs.com/zhizhixiaoxia/p/17414798.html

使用java.text包格式化数字和日期
TestFormat.javaimportjava.text.DateFormat;importjava.text.DecimalFormat;importjava.text.NumberFormat;importjava.text.SimpleDateFormat;importjava.util.Date;publicclassTestFormat{publicstaticvoidmain(String[]args){defaultNumberFor......
[Rust] Option
fnmultiply(num:Option<usize>)->usize{returnnum.unwrap_or(0)*5;}fnmultiply1(num:Option<usize>)->Option<usize>{matchnum{Some(num)=>Some(num*5),None=>None,}}fnmultiply......
Midjourney|文心一格prompt教程[Text Prompt（下篇）]：游戏、实物、人物、风景、动漫、邮票
Midjourney|文心一格prompt教程[TextPrompt（下篇）]：游戏、实物、人物、风景、动漫、邮票、海报等生成，终极模板教学场景6：游戏Prompt真的越长越好吗？按照Midjourney的官方文档里的说法，并不一定：Promptscanbeverysimple.Singlewords(orevenanemoji!)willproducean......
Pytext上手——Intent-Slot 模型实战
1意图分类任务简介对话系统里，首先要对用户的输入进行领域、意图识别和槽抽取。深度学习发展以后，意图识别的方法多使用深度学习的算法，使用CNN对意图进行多分类，领域分类和意图分类较为类似。而槽的预测可以看成是标签序列预测问题。例如句子“我想听周杰伦的菊花台”，标签可以定义为......
nvidia optimus 双显卡 Ubuntu驱动问题
NVIDIAOptimus介绍：http://baike.baidu.com/view/4266252.htm好了问题来了，装Xorg还有官方驱动都成问题了。目前解决方案进入Bios禁用一块显卡。集显能禁掉吗，可是笔记本的BIOS里好像根本没有那个选项，在WIN7下禁掉集显直接黑屏，U下是什么情况？使用这种技术机器有GT420M,GT425M,G......
【Antd 】selsect 的 option 选项随页面滚动，或被遮挡解决办法
<divstyle={{padding:100,height:1000,background:'#eee',position:'relative'}}id="area"><h4>可滚动的区域/scrollablearea</h4><SelectdefaultValue="lucy"style={......
SAP ABAP 系统里长文本 Long Text 的设计和读取函数 READ_TEXT 详细讲解试读版
本文回答本教程一位学习者在笔者的知识星球里的提问。要想找到这个问题的根源，需要首先对SAPABAP系统里长文本(LongText)的设计有一个比较清楚的了解，这就是本文及后续文章的目的。SAPABAP长文本的使用场景在SAPABAP系统中，长文本（LongText）是一种特殊的文本类型，它可以存......
解决 Element 文本域(textarea) 和文本(text) 字体不同的问题
修改css.el-textarea__inner{font-family:"HelveticaNeue",Helvetica,"PingFangSC","HiraginoSansGB","MicrosoftYaHei","微软雅黑",Arial,sans-serif;}修改后:......
使用doop识别最近commons text漏洞的污点信息流
作者：vivo互联网安全团队-ChenHaojie本文基于笔者对doop静态程序分析框架源代码和规则学习，并结合对目前漏洞公开技术细节的学习，修改增强doopapponly模式下的分析规则后，实现通过doop工具识别commonstextrce漏洞（CVE-2022-42889）。内容包含三部分，第一部分简单介绍doop分析框架......
使用doop识别最近commons text漏洞的污点信息流
作者：vivo互联网安全团队-ChenHaojie本文基于笔者对doop静态程序分析框架源代码和规则学习，并结合对目前漏洞公开技术细节的学习，修改增强doopapponly模式下的分析规则后，实现通过doop工具识别commonstextrce漏洞（CVE-2022-42889）。内容包含三部分，第一部分简单介绍doop分析框架，第......

text-generation-webui安装部署的过程-window版本，最后成功运行OPT大模型

相关文章

赞助商

阅读排行