首页 > 其他分享 >搭建清华ChatGLM2-6B

搭建清华ChatGLM2-6B

时间:2024-04-19 16:46:31浏览次数:32  
标签:6B 清华 python ChatGLM2 int4 conda https

一、环境配置

  ChatGLM2-6B至少需要13G GPU(虽然官网说12G即可),int8需要8G,int4需要4G。

  Win10系统,GTX1060显卡6GB(只能用int4模型,亲测开启GLM2时占了5GB以上)

  1、git  

  2、conda 

  3、python 3.9

  4、pip

  5、CUDA 11.1 (GPU相关)

  6、torch 1.10.1  (跟CUDA版本对应)

  

二、安装工具

  conda安装(Anaconda工具

  方便进行环境隔离,不影响其他项目,且随时删除重新创建。

  官网下载:https://www.anaconda.com/download/success

  参考教程:https://blog.csdn.net/weixin_42081445/article/details/136928005

  这里创建了py39新环境,点击绿色按钮=》选择Open Terminal终端。会看到前面带有(py39)这个时候,可以尝试conda list查看包,然后python进入的也是3.9版本。

  

  CUDA 安装(GPU相关)

    官网下载:https://developer.nvidia.com/cuda-11.1.0-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal

    参考教程:https://blog.csdn.net/qq_46126258/article/details/112708781

    通过 NVIDIA-smi 命令查看CUDA的版本(v11.1)和内存6GB。

 

  Torch框架(PyTorch)的安装(机器学习库)

    官方下载:https://pytorch.org/get-started/previous-versions/#v1101

    torch的版本是1.10.1(对应CUDA 11.1)

# conda
(py39)~]# conda install pytorch==1.10.1 torchvision==0.11.2 torchaudio==0.10.1 -c pytorch

 

三、安装项目

  ChatGLM2-6B项目

    Github项目:https://github.com/THUDM/ChatGLM2-6B

~]# git clone https://github.com/THUDM/ChatGLM2-6B
~]# cd ChatGLM2-6B

    查看文件夹中的requirements.txt的列表,因为安装了torch库,所以这里删除torch的条目。 

     执行pip下载文件。(清华源镜像,在后面加:-i https://pypi.tuna.tsinghua.edu.cn/simple/ )

~]# pip install -r requirements.txt
~]# pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

  模型数据 

    模型数据:https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p=%2F&mode=list

    模型数据项目:https://huggingface.co/THUDM/chatglm2-6b/tree/main

    显卡内存为6GB,所以符合int4的模型。模型量化会带来一定的性能损失,ChatGLM2-6B 在 4-bit 量化下仍然能够进行自然流畅的生成。

~]# git clone https://huggingface.co/THUDM/chatglm2-6b-int4

    

四、部署运行

  先修改对应文件的内容,将红色框框改成自定义的chatglm2-6b-int4的路径。

  运行模式:

    1.api方式部启动,执行命令: python api.py

    2.命令行方式启动,执行命令:python cli_demo.py

    3.网页方式启动,执行命令:python web_demo.py

    4. OpenAI 格式启动,执行命令:python openai_api.py

  这边试用网页方式启动。可以访问http://127.0.0.1:7860/

 

 

 

标签:6B,清华,python,ChatGLM2,int4,conda,https
From: https://www.cnblogs.com/zrl66/p/18141911

相关文章

  • 编译原理(清华大学版)第三章
    第三章词法分析正规式、正规文法设\(G=(V_N,V_T,P,S)\),如果P中每一个产生式的形式都是\(A\rightarrowaB\)或\(A\rightarrowa\),其中\(A,B\)都是非终结符,\(a\inV_T^*\),则是3型或正规文法。正规文法所描述的是\(V_T\)上的正规集,即通过\(V_N,V_T,P,S\)来表示。正规式也称正则......
  • CF1946B Maximum Sum 题解
    题目简述你有一个由$n$个整数组成的数组$a$。你要对它进行$k$次操作。在一次操作中,你选择了数组$a$的任意连续子数组(可能为空),并在数组的任意位置插入了该子数组的和。你的任务是找出经过$k$次操作后数组的最大和。题目分析这道题显然是一道贪心题。对于第$1$次操......
  • 编译原理(清华大学版)第二章
    第二章文法和语言符号和符号串字母表是元素的非空有穷集合字母表中的元素称为符号字母表中的符号可以组成的任何又穷序列称为符号串符号串运算:1.符号串的头尾,固有头和固有尾​ \(z=xy,只对头感兴趣则可以写为z=x...\)2.符号串的链接​ $符号串x、y,连接之后为xy;\spac......
  • 编译原理(清华大学版)第一章
    第一章概论基本概念 词法分析经过词法分析器识别出Token,把字符串转化为一个个Token。Token包括:关键字、标识符、界符等语法分析把Token串转换成体现语法规则的抽象树(AST)语义分析审查源程序有无语义错误找到变量的作用域识别执行的运算方式进行类型......
  • (o゚v゚)ノ 清华镜像地址 (o゚v゚) ノ查看pytorch版本 (o゚v゚)ノ查看cuda版本的命令。。。
    清华镜像地址pipinstallxxx-ihttps://pypi.tuna.tsinghua.edu.cn/simple安装pytorch#CUDA11.8condainstallpytorch==2.1.2torchvision==0.16.2torchaudio==2.1.2pytorch-cuda=11.8-cpytorch-cnvidia安装DGL#Ifyouhaveinstalleddgl-cudaXX.Xpack......
  • Ubuntu安装chatGLM3-6b
    目录概述安装Anaconda3原文链接下载Anaconda3安装Anaconda3执行bash安装提示“conda:未找到命令”的解决办法anaconda3常用命令添加/更换conda清华源下载chatglm3-6b模型下载chatglm3壳子概述本文主要介绍如何在Ubuntu上安装ChatGLM3-6b模型。只有6B模型支持functi......
  • CondeseNetV2:清华与华为出品,保持特征的新鲜是特征复用的关键 | CVPR 2021
    论文提出SFR模块,直接重新激活一组浅层特征来提升其在后续层的复用效率,而且整个重激活模式可端到端学习。由于重激活的稀疏性,额外引入的计算量非常小。从实验结果来看,基于SFR模块提出的CondeseNetV2性能还是很不错的,值得学习 来源:晓飞的算法工程笔记公众号论文:CondenseNet......
  • 开源模型应用落地-chatglm3-6b模型小试-入门篇(二)
       一、前言   刚开始接触AI时,您可能会感到困惑,因为面对众多开源模型的选择,不知道应该选择哪个模型,也不知道如何调用最基本的模型。但是不用担心,我将陪伴您一起逐步入门,解决这些问题。   在信息时代,我们可以轻松地通过互联网获取大量的理论知识和概念。然而,仅仅......
  • MC14516BDR2G倒数计数器芯片中文资料PDF数据手册参数引脚图图片特性概述
    产品概述:MC14516B同步正数/倒数二进制计数器在一个单片结构中使用MOSP沟道和N沟道增强模式器件构造。此计数器可通过对预设输入(P0、P1、P2、P3)应用所需的二进制值,然后将预设启用(PE)置于高电平,来进行预设。计数方向通过向UP/DOWN输入应用高电平(用于正数)或低电平(用于......
  • MC14516BDR2G倒数计数器芯片中文资料PDF数据手册参数引脚图图片特性概述
    产品概述:MC14516B同步正数/倒数二进制计数器在一个单片结构中使用MOSP沟道和N沟道增强模式器件构造。此计数器可通过对预设输入(P0、P1、P2、P3)应用所需的二进制值,然后将预设启用(PE)置于高电平,来进行预设。计数方向通过向UP/DOWN输入应用高电平(用于正数)或低电平(用于......