首页 > 其他分享 >快速调用 GLM-4-9B-Chat 语言模型

快速调用 GLM-4-9B-Chat 语言模型

时间:2024-07-02 15:56:22浏览次数:14  
标签:inputs torch GLM outputs 9B chat Chat True glm

一、确认本机显卡配置

二、下载大模型

国内可以从魔搭社区下载,

下载地址:https://modelscope.cn/models/ZhipuAI/glm-4-9b-chat/files 

 

三、运行官方代码

 

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

device = "cuda"

tokenizer = AutoTokenizer.from_pretrained("E:\openai\ChatGLM4\glm-4-9b-chat", trust_remote_code=True)

query = "你好"

inputs = tokenizer.apply_chat_template([{"role": "user", "content": query}],
                                       add_generation_prompt=True,
                                       tokenize=True,
                                       return_tensors="pt",
                                       return_dict=True
                                       )

inputs = inputs.to(device)
model = AutoModelForCausalLM.from_pretrained(
    "E:\openai\ChatGLM4\glm-4-9b-chat",
    torch_dtype=torch.bfloat16,
    low_cpu_mem_usage=True,
    trust_remote_code=True
).to(device).eval()

gen_kwargs = {"max_length": 2500, "do_sample": True, "top_k": 1}
with torch.no_grad():
    outputs = model.generate(**inputs, **gen_kwargs)
    outputs = outputs[:, inputs['input_ids'].shape[1]:]
    print(tokenizer.decode(outputs[0], skip_special_tokens=True))

结果如下

 

中间需要安装环境,建议用anaconda来安装

 

标签:inputs,torch,GLM,outputs,9B,chat,Chat,True,glm
From: https://www.cnblogs.com/txw1958/p/18279993

相关文章

  • 从人工到自动化到AIOps再到ChatOps:大模型在运维领域的应用
    一、引言在信息技术飞速发展的今天,运维工作已经从最初的人工操作,逐步演变为自动化、AIOps(人工智能运维)和ChatOps(通过聊天的方式去运维)。这些变革不仅提升了运维效率,还显著保障了系统的稳定性。特别是借助大模型,运维同学能够更加高效地完成工作,并应对复杂的运维挑战。本文将依次介......
  • 最新AI智能问答AI绘画ChatGPT系统、TTS & 语音识别,文档分析、GPT-4o多模态识图理解,一
    一、前言人工智能语言模型和AI绘画在多个领域都有广泛的应用。以下是一些它们的主要用处人工智能语言模型内容生成写作辅助:帮助撰写文章、博客、报告、剧本等。代码生成:自动生成或补全代码,提高编程效率。创意写作:生成故事、诗歌、歌词等创意性内容。对话系统客服系......
  • 英语背单词 专四词汇 2024年07月 ChatGPT
    2024-07-01IndexWordPronunciationPartsofSpeechExplanationTranslationinChinese1badge/bædʒ/nounAsmallobject,typicallyround,thatsignifiesmembership,achievement,orauthority.徽章;证章2milky/ˈmɪlki/adjectiveResemblingorco......
  • 最新AIGC系统源码-ChatGPT商业版系统源码,自定义ChatGPT指令Promp提示词,AI绘画系统,AI换
    目录一、前言系统文档二、系统演示核心AI能力系统快速体验三、系统功能模块3.1AI全模型支持/插件系统AI模型提问文档分析​识图理解能力3.2GPts应用3.2.1GPTs应用3.2.2GPTs工作台3.2.3自定义创建Promp指令预设应用3.3AI专业绘画3.3.1文生图/图生图(垫图)......
  • 开源项目相关:ChatGPT学习过程
    大规模无标注数据预训练:ChatGPT首先使用大规模的无标注数据进行预训练。例如,它可能使用了8.5亿对话对来学习对话的表达与交互方式。这一步主要依赖Transformer等神经网络结构,通过预测下一个词来学习语言的统计规律和语义知识。自监督学习:在预训练过程中,ChatGPT将对话划分为utt......
  • 【动画进阶】类 ChatGpt 多行文本打字效果
    今天我们来学习一个有意思的多行文本输入打字效果,像是这样:这个效果其实本身并非特别困难,实现的方式也很多,在本文中,我们更多的会聚焦于整个多行打字效果最后的动态光标的实现。也就是如何在文本不断变长,在不确定行数的情况下,让文字的最末行右侧处,一直有一个不断闪烁的光标效果:......
  • (五)DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍
    DeepSpeedChat:一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍如需引用DeepSpeedChat,请引用我们的arxivreport:@article{yao2023dschat,title={{DeepSpeed-Chat:Easy,FastandAffordableRLHFTrainingofChatGPT-likeModelsatAllScales}},autho......
  • [本科项目实训] ChatGLM3 与 ChatGLM4 简述
    ChatGLM3-6B简述ChatGLM3-6B是ChatGLM系列最新一代的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B引入了如下特性:更强大的基础模型:ChatGLM3-6B的基础模型ChatGLM3-6B-Base采用了更多样的训练数据、更充分的训练步数和更合理的......
  • 基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS
    介绍ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。ChatTTSwebUI&API为ChatTTS提供了网页界面和API服务。资源编排服务(ResourceOrchestrationService,ROS)是阿里云提......
  • 颠覆传统编程,用ChatGPT十倍提升生产力
    我们即将见证一个新的时代!这是最好的时代,也是最坏的时代!需求背景背景:平时会编写博客,并且会把这个博客上传到github上,然后自己买一个域名挂到github上。我平时编写的博客会有一些图片来辅助说明的,写完之后如果我把图片和文字全部都上传到博客网站,后期图片很多时就会导致网......