首页 > 其他分享 >一、【ChatGLM-6B学习】-搭建一个简单的大模型

一、【ChatGLM-6B学习】-搭建一个简单的大模型

时间:2023-08-25 15:23:39浏览次数:39  
标签:6B python 模型 虚拟环境 ChatGLM 下载 搭建

最近业务上需要用到大模型相关的知识,所以准备简单的搭建一个环境,详细的细节后面慢慢研究,现记录下搭建过程。至于为什么选择ChatGLM-6B,主要原因是它支持中英双语,同时支持离线部署,可以方便的构建本地化的问答知识库。

由于ChatGLM-6B对python版本有一定要求,目前要求3.7+版本,为了减少python版本冲突的影响,可以通过使用conda来管理python环境。

安装Anaconda3

1、下载地址:https://www.anaconda.com/download/,选择自己机器对应的版本下载,我这里以Linux环境

2、安装:执行脚本   bash Anaconda3-2022.5-Linux-x86_64.sh

创建python虚拟环境

1、创建虚拟环境:conda create --name xxx_name pyhton=3.8     # xxx_name 为创建的虚拟环境的名称  通过python指定相应的版本,这里需要>=3.7即可

2、激活虚拟环境:source activate xxx_name

部署ChatGLM-6B

1、下载ChatGLM-6B代码

git clone https://github.com/THUDM/ChatGLM-6B.git

进入到ChatGLM-6B中,执行相应的安装命令

pip install gradio     # 用于启动图形化界面

pip install -r requrement.txt

 

2、下载模型代码(ChatGLM-6B的模型代码在huggingface上托管:https://huggingface.co/THUDM/chatglm-6b)

下载模型代码不是必须的,可以启动后在线下载,不过受限于网络速度,这里提前下载好放在本地,并修改代码指向本地模型。

git clone https://huggingface.co/THUDM/chatglm-6b

 

3、修改web_demo.py的模型应用路径如下图:

 

4、启动

python web_demo.py

 

实现效果

通过启动完成后的链接访问,如下:

 参数解释:

Maximum length:限制输入序列的最大长度

Top P:指在生成文本等任务中,选择可能性最高的前P个词的概率累加和(值越高,准确性更高,但是多样性可能降低)

Temperature:增加或减少模型对不同类别的置信度(值越小,会使得模型更加自信)

 

常见问题/报错:

1、RuntimeError

 解决办法:

a、检查下载的模型文件是否完整(8个文件每个都在1G以上,痛殴对比文件大小可以看出来是否正确)

b、检查模型文件中的其他文件是否和huggingface仓库文件一致,如果不一致可以手动下载

 

2、CUDA OOM问题

解决办法:

 

标签:6B,python,模型,虚拟环境,ChatGLM,下载,搭建
From: https://www.cnblogs.com/funnyboy0128/p/17633461.html

相关文章

  • 直播平台搭建,JSON.parseObject的几种用法
    直播平台搭建,JSON.parseObject的几种用法一.result格式: {  "success":"true",  "returnAddress":"123"} JSONObjectjsonObject=JSON.parseObject(result); //转换成objectJsonObject.getString("returnAddress") //获取object中ret......
  • docker-compose的简单使用并搭建zookeeper集群
    简介DockerCompose是一个用于定义和运行多容器Docker应用程序的工具。它能够简化在单个主机上使用多个容器的部署过程。使用DockerCompose,您可以使用简单的YAML文件来定义应用程序的服务、网络和卷,并通过单个命令一键启动、停止和重建整个应用程序。DockerCompose允许......
  • iOS开发之--搭建本地的SVN服务器
    近期入职的新公司,后台没有分配svn账号,需要在本地搭建一个服务器,方便和代码,看了看网上的教程,一直有这样那样的问题,其中最主要的问题还是路径拼接的问题,最后终于解决了,特在此分享下,如果大家有更快捷的方法可以交流下:步骤如下:1,首先在任意地方建立一个文件夹,如在桌面上建立一个名字为sv......
  • DNSLOG平台搭建及其原理分析
    一、DNS基本概念0x1:DNS中不同域名类型概念DNS的全称是DomainNameSystem(网络名称系统),它作为将域名和IP地址相互映射,使人更方便地访问互联网。当用户输入某一网址如littlehann.com,网络上的DNSServer会将该域名解析,并找到对应的真实IP如101.37.97.51,使用户可以访问这台服务器上......
  • 汇编语言编译环境搭建(MASM+NASM)
    (目录)一、Windows1.下载相关软件DOSBox官网:https://sourceforge.net/projects/dosbox/下载:DOSBox0.74-3-win32-installer.exeMASM5.0网上可以下载2.配置环境双击之后,修改配置文件:windowresolution=1024x768output=ddraw在DOSBox模拟器中挂载MASM5.0mountc:d......
  • Docker下spark环境搭建
    RUNecho"InstallSpark"&&\wget-O/tmp/spark-2.3.4-bin-hadoop2.6.tgzhttp://mirror.bit.edu.cn/apache/spark/spark-2.3.4/spark-2.3.4-bin-hadoop2.6.tgz&&\cd/tmp/&&\tar-zxvf/tmp/spark-2.3.4-bin-hado......
  • Eureka-搭建eureka服务
            ......
  • centos简单搭建git服务端
    注意事项:1、git常用的客户端管理工具有sourcetree、TortoiseGit,个人比较喜欢sourcetree2、按照本文装的git服务端如果需要创建用户得在命令行操作,也可部署gitlab开源项目实现在web端进行管理用户3、如果觉得麻烦不想自己部署,也可直接把代码推广到github上本人采用的是virtualbo......
  • ShowMeBug X 国信证券 | 提升金融企业技术人才识别效率,实现高效团队搭建
    国信证券股份有限公司(以下称国信证券)与ShowMeBug完成签约。ShowMeBug技术测评平台助力国信证券将招聘流程部分线上化,HR大幅减少了人才出筛时间,加速了整体招聘进程,提升了人才识别效率,推动建设更加坚实的技术人才团队。国信证券借助支持多种编程框架语言的技术测评系统 ShowMeBug......
  • VisionPro C#混合编程环境搭建(基于VS2019)
    VisionPro工具分组(因为Vs2019导入VisionPro是全导入,为了方便,可以自建项进行分类)各选择项1VisionProToolEditControls2VisionProDisplayControls3VisionProShapeEditControls4VisionProSystemControls各选择项下的组件VisionProDisplayControls:CogRecor......