首页 > 其他分享 >一、【ChatGLM-6B学习】-搭建一个简单的大模型

一、【ChatGLM-6B学习】-搭建一个简单的大模型

时间：2023-08-25 15:23:39浏览次数：39

标签：6B python 模型虚拟环境 ChatGLM 下载搭建

最近业务上需要用到大模型相关的知识，所以准备简单的搭建一个环境，详细的细节后面慢慢研究，现记录下搭建过程。至于为什么选择ChatGLM-6B,主要原因是它支持中英双语，同时支持离线部署，可以方便的构建本地化的问答知识库。

由于ChatGLM-6B对python版本有一定要求，目前要求3.7+版本，为了减少python版本冲突的影响，可以通过使用conda来管理python环境。

安装Anaconda3

1、下载地址：https://www.anaconda.com/download/，选择自己机器对应的版本下载，我这里以Linux环境

2、安装：执行脚本 bash Anaconda3-2022.5-Linux-x86_64.sh

创建python虚拟环境

1、创建虚拟环境：conda create --name xxx_name pyhton=3.8 # xxx_name 为创建的虚拟环境的名称通过python指定相应的版本，这里需要>=3.7即可

2、激活虚拟环境：source activate xxx_name

部署ChatGLM-6B

1、下载ChatGLM-6B代码

git clone https://github.com/THUDM/ChatGLM-6B.git

进入到ChatGLM-6B中，执行相应的安装命令

pip install gradio # 用于启动图形化界面

pip install -r requrement.txt

2、下载模型代码（ChatGLM-6B的模型代码在huggingface上托管：https://huggingface.co/THUDM/chatglm-6b）

下载模型代码不是必须的，可以启动后在线下载，不过受限于网络速度，这里提前下载好放在本地，并修改代码指向本地模型。

git clone https://huggingface.co/THUDM/chatglm-6b

3、修改web_demo.py的模型应用路径如下图：

4、启动

python web_demo.py

实现效果

通过启动完成后的链接访问，如下：

参数解释：

Maximum length：限制输入序列的最大长度

Top P：指在生成文本等任务中，选择可能性最高的前P个词的概率累加和（值越高，准确性更高，但是多样性可能降低）

Temperature：增加或减少模型对不同类别的置信度（值越小，会使得模型更加自信）

常见问题/报错：

1、RuntimeError

解决办法：

a、检查下载的模型文件是否完整（8个文件每个都在1G以上，痛殴对比文件大小可以看出来是否正确）

b、检查模型文件中的其他文件是否和huggingface仓库文件一致，如果不一致可以手动下载

2、CUDA OOM问题

解决办法：

标签：6B,python,模型,虚拟环境,ChatGLM,下载,搭建
From： https://www.cnblogs.com/funnyboy0128/p/17633461.html

相关文章

直播平台搭建，JSON.parseObject的几种用法
直播平台搭建，JSON.parseObject的几种用法一.result格式: { "success":"true", "returnAddress":"123"} JSONObjectjsonObject=JSON.parseObject(result); //转换成objectJsonObject.getString("returnAddress") //获取object中ret......
docker-compose的简单使用并搭建zookeeper集群
简介DockerCompose是一个用于定义和运行多容器Docker应用程序的工具。它能够简化在单个主机上使用多个容器的部署过程。使用DockerCompose，您可以使用简单的YAML文件来定义应用程序的服务、网络和卷，并通过单个命令一键启动、停止和重建整个应用程序。DockerCompose允许......
iOS开发之--搭建本地的SVN服务器
近期入职的新公司，后台没有分配svn账号，需要在本地搭建一个服务器，方便和代码，看了看网上的教程，一直有这样那样的问题，其中最主要的问题还是路径拼接的问题，最后终于解决了，特在此分享下，如果大家有更快捷的方法可以交流下：步骤如下：1，首先在任意地方建立一个文件夹，如在桌面上建立一个名字为sv......
DNSLOG平台搭建及其原理分析
一、DNS基本概念0x1：DNS中不同域名类型概念DNS的全称是DomainNameSystem（网络名称系统），它作为将域名和IP地址相互映射，使人更方便地访问互联网。当用户输入某一网址如littlehann.com，网络上的DNSServer会将该域名解析，并找到对应的真实IP如101.37.97.51，使用户可以访问这台服务器上......
汇编语言编译环境搭建（MASM+NASM）
(目录)一、Windows1.下载相关软件DOSBox官网：https://sourceforge.net/projects/dosbox/下载：DOSBox0.74-3-win32-installer.exeMASM5.0网上可以下载2.配置环境双击之后，修改配置文件：windowresolution=1024x768output=ddraw在DOSBox模拟器中挂载MASM5.0mountc:d......
Docker下spark环境搭建
RUNecho"InstallSpark"&&\wget-O/tmp/spark-2.3.4-bin-hadoop2.6.tgzhttp://mirror.bit.edu.cn/apache/spark/spark-2.3.4/spark-2.3.4-bin-hadoop2.6.tgz&&\cd/tmp/&&\tar-zxvf/tmp/spark-2.3.4-bin-hado......
Eureka-搭建eureka服务
......
centos简单搭建git服务端
注意事项:1、git常用的客户端管理工具有sourcetree、TortoiseGit，个人比较喜欢sourcetree2、按照本文装的git服务端如果需要创建用户得在命令行操作，也可部署gitlab开源项目实现在web端进行管理用户3、如果觉得麻烦不想自己部署，也可直接把代码推广到github上本人采用的是virtualbo......
ShowMeBug X 国信证券 | 提升金融企业技术人才识别效率，实现高效团队搭建
国信证券股份有限公司（以下称国信证券）与ShowMeBug完成签约。ShowMeBug技术测评平台助力国信证券将招聘流程部分线上化，HR大幅减少了人才出筛时间，加速了整体招聘进程，提升了人才识别效率，推动建设更加坚实的技术人才团队。国信证券借助支持多种编程框架语言的技术测评系统 ShowMeBug......
VisionPro C#混合编程环境搭建(基于VS2019)
VisionPro工具分组（因为Vs2019导入VisionPro是全导入，为了方便，可以自建项进行分类）各选择项1VisionProToolEditControls2VisionProDisplayControls3VisionProShapeEditControls4VisionProSystemControls各选择项下的组件VisionProDisplayControls:CogRecor......

赞助商

阅读排行