清华大学ChatGLM大模型

时间：2024-08-28 17:27:32浏览次数：13

标签：6B 模型清华大学 ChatGLM model response history

ChatGLM 大模型

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答，更多信息请参考我们的博客。欢迎通过 chatglm.cn 体验更大规模的 ChatGLM 模型。

为了方便下游开发者针对自己的应用场景定制模型，我们同时实现了基于 P-Tuning v2 的高效参数微调方法 (使用指南) ，INT4 量化级别下最低只需 7GB 显存即可启动微调。

ChatGLM-6B 权重对学术研究完全开放，在填写问卷进行登记后亦允许免费商业使用。

安装

使用 pip 安装依赖：pip install -r requirements.txt，其中 transformers 库版本推荐为 4.27.1，但理论上不低于 4.23.1 即可。

此外，如果需要在 cpu 上运行量化后的模型，还需要安装 gcc 与 openmp。多数 Linux 发行版默认已安装。对于 Windows ，可在安装 TDM-GCC 时勾选 openmp。Windows 测试环境 gcc 版本为 TDM-GCC 10.3.0， Linux 为 gcc 11.3.0。在 MacOS 上请参考 Q1。

使用


>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
>>> model = model.eval()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好
标签：6B,模型,清华大学,ChatGLM,model,response,history	

From： https://www.cnblogs.com/hogwarts/p/18385184

软件设计师全套备考系列文章13 -- 数据库：概念、三级模式两级映像、设计过程、数据模型
软考--软件设计师（13）--数据库：概念、三级模式两级映像、设计过程、数据模型文章目录软考--软件设计师（13）--数据库：概念、三级模式两级映像、设计过程、数据模型前言一、章节考点二、基本概念三、三级模式、两级映像四、设计过程五、数据模型前言考试时间：每年5月、......
智谱开源 CogVideoX-5B 视频生成模型，RTX 3060 显卡可运行；曝 OpenAI 模型「草莓」今秋
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（Real-TimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编......
AI大模型智能体技术在企业商业展示中的应用方案
企业AI大模型智能体展厅解决方案旨在为企业展厅大屏或在线网站引入AI数字员工，通过全方位、互动性强、深度展示的方式，向来访者展示企业的战略、品牌、产品和服务，并突出展示企业所取得的成就和成果。数字员工可智能化处理不同访客的需求，实现语音交互和个性化介绍，提升企业展厅的互......
使用统计方法在AMD GPU上使用JAX Profiler可靠地比较大型生成AI模型中的算法性能
UsingstatisticalmethodstoreliablycomparealgorithmperformanceinlargegenerativeAImodelswithJAXProfileronAMDGPUs—ROCmBlogs摘要本文提供了一份详细的指南，介绍如何在JAX实现的生成AI模型中测量和比较各种算法的性能。利用JAXProfiler和统计分析......
.NET8 接入qwen2大语言模型
前言dotnet8项目接入qwen大模型，这个主要用到了大模型管理工具叫做ollama有了它，接入大模型soeasy。使用ollama可以接入很多大模型，详见：https://ollama.com/library环境vs2022previewdotent8Windows10企业版1、下载ollamahttps://github.com/ollama/ollama安装完成......
linux总线设备驱动模型
linux总线设备驱动模型platform平台驱动模型linux自带I2C、SPI、USB等总线。但是在SOC中有些外设是没有总线这个概念的，但是又要使用总线、驱动和设备模型该怎么办呢？为了解决此问题，Linux提出了platform这个虚拟总线，相应的就有platform_driver和platform_devi......
绘制ply模型顶点的法线（通过两点）
importtrimeshimportmatplotlib.pyplotasplt#读取点云文件mesh=trimesh.load_mesh('test.ply')#计算法线mesh.vertex_normals#创建一个新的图形窗口fig=plt.figure()ax=fig.add_subplot(111,projection='3d')#绘制顶点ax.scatter(mesh.vertices[:,......
AI大模型prompt "自洽性"和"思维树" 这两种的区别
一个是从多个角度对同一问题给出不同解答，选择最好的那个另外一个就像一棵树，有主干，还有分支，每个分支上还有更细分的理由比如:自洽性夏季气温升高是因为太阳光线更直接地照射到地球上。在夏天，太阳的光线以更垂直的角度到达地球表面，导致热量更集中。夏天，白天时间长，太阳照射的......
Apache RocketMQ 批处理模型演进之路
作者：谷乂RocketMQ的目标，是致力于打造一个消息、事件、流一体的超融合处理平台。这意味着它需要满足各个场景下各式各样的要求，而批量处理则是流计算领域对于极致吞吐量要求的经典解法，这当然也意味着RocketMQ也有一套属于自己风格的批处理模型。至于什么样的批量模型才叫“属于......
揭秘大模型概念与应用：探讨其在不同场景下的落地实践
大模型是什么？大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域，大模型通常是指具有数百万到数十亿参数的神经网络模型。大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域，大模型通常是指具有数百万到数十亿参数的神经网......

清华大学ChatGLM大模型

ChatGLM 大模型

安装

使用

相关文章

赞助商

阅读排行