首页 > 其他分享 >ChatGLM 模型部署

ChatGLM 模型部署

时间:2023-12-07 10:46:01浏览次数:23  
标签:tokenizer 部署 模型 id ChatGLM model True response history

ChatGLM 模型部署

  1. 模型地址:
  2. huggingface:https://huggingface.co/THUDM/chatglm3-6b
  3. modelscope:https://modelscope.cn/models/ZhipuAI/chatglm3-6b/summary

搭建环境

# 下载代码
$ git clone https://github.com/THUDM/ChatGLM3
$ cd ChatGLM3

# 创建环境
$ conda create -n py310_chat python=3.10       # 创建新环境
$ source activate py310_chat                   # 激活环境

# 安装依赖
$ pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
    
# 下载模型
# 从modelscope上下载模型
from modelscope.hub.snapshot_download import snapshot_download

model_dir = snapshot_download('THUDM/chatglm3-6b', cache_dir='./model', revision='master')

模型推理

可以通过如下代码调用 ChatGLM 模型来生成对话:

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True, device='cuda')
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)
>>>
晚上睡不着可能会让你感到焦虑或不舒服,但以下是一些可以帮助你入睡的方法:

你好

标签:tokenizer,部署,模型,id,ChatGLM,model,True,response,history
From: https://www.cnblogs.com/idazhi/p/17881177.html

相关文章

  • 倾斜摄影三维模型的根节点合并的模型质量提升方法探讨
    倾斜摄影三维模型的根节点合并的模型质量提升方法探讨 倾斜摄影三维模型的根节点合并是一种重要的技术,可以减小数据大小、提高渲染效率和加载速度。但同时也可能对模型的质量产生一定的影响。在本文中,我们将分析倾斜摄影三维模型的根节点合并的模型质量提升方法。1、LOD(层次......
  • 使用预训练语言模型作帖子分类
    ​​ 预训练语言模型PLMs或PTMs应用广泛且效果良好。有的文章中把自然语言处理中的预训练语言模型的发展划分为4个时代:词入时代,上下文嵌入(ContextWordEmbedding)时代、预训练语言模型时代、改进型和领域定制型时代。为什么需要预训练​ 模型通常需要非常大的参数量,但并不是......
  • 数据分享|AARRR模型淘宝用户行为分析、电商销售分析
    全文链接:https://tecdat.cn/?p=34482原文出处:拓端数据部落公众号分析师:YeYuan随着互联网、5G时代到来,大数据横空出世,数据变得越来越重要,如何针对业务问题和需求,提取有效特征数据并对问题进行深入分析,最终得到可靠的结论是数据分析最核心的环节,只有得出正确的结论才能对症下药......
  • R语言SIR模型网络结构扩散过程模拟SIR模型(Susceptible Infected Recovered )代码实例|
    全文链接:http://tecdat.cn/?p=14593最近我们被客户要求撰写关于SIR模型的研究报告,包括一些图形和统计输出。与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。这里介绍一个使用R模拟网络扩散的例子基本的算法非常简单:生成一个网络:g(V,E)。随机选择一个或几......
  • skywalking 部署安装 https://blog.csdn.net/swg321321/article/details/129704345
    https://blog.csdn.net/swg321321/article/details/129704345 前言在分布式系统中会出现服务间的相互调用,且服务数量众多。一般会出现如下异常请求出现异常,需要定位定位具体是哪个服务器发生异常,需要对这个请求链路一步一步调试才能确定那个服务出现异常。出现定位异常服务难......
  • 俄罗斯AI突破:Kandinsky-3模型的创新与性能解析
    引言俄罗斯AI研究团队AIForever在开源领域再次取得显著成就,推出了Kandinsky-3模型。这一模型以其11.9B的庞大参数量,不仅刷新了开源文生图模型的规模纪录,也代表了俄罗斯在AI技术方面的重要突破。Kandinsky2.2与Kandinsky-3的演进Kandinsky-3的前身Kandinsky2.2结合了DALL-E2和La......
  • 大模型词表构建
    1.引言在文本输入embedding层之前,以中文文本为例,首先对文本进行分词并进行one-hot编码,分词肯定是根据词表来进行分词,那构建一个合适的词表就显得至关重要,过大或者过小都会对后续模型的训练效果产生影响。所以这里介绍当前各个大模型的词表构建方法。2.技术基础在介绍具体的词......
  • 史文钊谈数字技术在医学创新中的应用:大模型不求大,贵在精
    近日,国际性学术会议“北京论坛2023”隆重召开,迄今已举办20届。本届论坛以“文明的和谐与共同繁荣——传承与互鉴”为主题,下设16个分论坛和4个专题论坛,来自国内外各领域的600余位顶级专家学者聚焦后疫情时代的全球可持续发展,通过对话与交流为解决新时代课题贡献智慧。作为北......
  • wiki confluence 8.7.1最新版安装部署 支持docker安装
    截止到2023年12月confluence最新版本为8.7.1,支持docker安装、linux常规安装、windows常规安装,下面就以docker安装部署为例,常规安装部署方法可以参考【仅限学习研究用,请支持正版】一、系统环境要求linux系统推荐centos系统4核8G+100G硬盘 二、安装部署1、先关闭防火墙......
  • 部署文档
    下载地址https://kafka.apache.org/downloads.html解压安装包tar-zxvfkafka_2.12-3.0.0.tgz修改配置文件//修改config下的server.properties文件cdconfig/vimserver.properties//broker的全局唯一编号,不能重复,只能是数字。broker.id=0//处理网络请求的线程数量......