首页 > 其他分享 >打败GPT-4的最强开源中文大模型GLM-4终于亮相了(附:超详细搭建过程)

打败GPT-4的最强开源中文大模型GLM-4终于亮相了(附:超详细搭建过程)

时间:2024-06-09 16:33:59浏览次数:14  
标签:https GLM 模型 开源 install GPT 安装

GLM-4是由智谱AI推出的新一代基座预处理大模型,具有与GPT-4相近的性能,尤其在中文能力上可以比肩GPT-4。

它在多个方面进行了优化和提升,包括支持更长的上下文长度、更快的推理速度、降低推理成本,以及增强了智能体能力。

GLM-4能够处理128k的上下文窗口长度,单次提示词可以处理的文本量达到300页,在"大海捞针"测试中展现了几乎100%的精度召回能力。

此外,GLM-4在多模态能力上也有显著进展,效果超过开源SD模型,逼近DALLE-3,使其在图像识别、语音识别等领域具有广泛的应用前景。

它还具备All Tools能力,能够自主理解和执行复杂任务,调用浏览器、代码解释器等工具完成工作。用户还可以通过智谱官网创建个性化的GLM智能体,实现大模型开发定制。

在性能方面,GLM-4在多个英文数据集上的表现接近GPT-4,如MMLU、GSM8K、MATH等,展现了强大的基础能力。

同时,GLM-4在中文对齐能力上整体超过GPT-4,显示出在中文理解和处理上的优势。

glm-4开源项目的github地址为:https://github.com/THUDM/GLM-4。

目前glm-4开源了多个版本,分别如下:

1、GLM-4-9B:这是GLM-4系列中的开源版本,是一个大型的预训练语言模型。它在多语义、数学、推理、代码和知识等多方面的数据集评测中表现出色,性能超越了Llama-3-8B。

2、GLM-4-9B-Chat:这是GLM-4-9B的人类偏好对齐版本,专为聊天而优化。它支持多轮对话,并且具备网页浏览、代码执行、自定义工具调用和长文本推理等高级功能。

3、GLM-4-9B-Chat-1M:这是一个支持1M上下文长度的模型,大约可以处理200万中文字符。它为需要处理长文本的应用提供了支持。

4、GLM-4V-9B:这是一个多模态模型,具备视觉理解能力。它支持高分辨率下的中英双语多轮对话,并在多模态评测中表现出色。

此外,GLM-4模型还支持26种语言,包括日语、韩语和德语等。模型在多个评测基准上的表现都非常出色,例如在对话模型典型任务、基座模型典型任务、长文本、多语言能力和工具调用能力等方面。

一、环境安装

1、python环境

为了兼容更新的pytorch、transformer等库,建议安装python版本在3.10以上。

2、pip包依赖安装

首先需要安装支持cuda gpu推理的torch、torchvision以及torchaudio,建议安装2.3.0版本以上,安装命令如下:

pip install torch==2.3.0+cu118 torchvision==0.18.0+cu118 torchaudio==2.3.0 --extra-index-url https://download.pytorch.org/whl/cu118

然后,根据运行不同的glm-4模型环境,运行安装对应的requirement.txt,命令如下:

pip install -r basic_demo/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install -r composite_demo/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install -r finetune_demo/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

3、node.js和包管理器pnpm安装

若要使用浏览器和搜索功能,还需要启动浏览器后端。

首先,根据 Node.js(https://nodejs.org/en/download/package-manager)官网的指示安装 Node.js,然后安装包管理器 PNPM(https://pnpm.io) 之后安装浏览器服务的依赖:

cd browser

npm install -g pnpm

pnpm install

未完......

更多详细的请欢迎关注:杰哥新技术

标签:https,GLM,模型,开源,install,GPT,安装
From: https://blog.csdn.net/m0_71062934/article/details/139551111

相关文章

  • 仿东郊到家《十大教程》公众号+小程序+APP 往约到家 上门预约服务 全开源 运营版 预约
    修复技师定位问题1、数据概况(新增业务城市用户投票功能,更加直观的查看业务城市的关注度、人气和影响力,促进业务开展)2、数据概况(增加可视化数据大盘,代理商端可查看自己下面的技师服务时长、在线时长、业绩、积分、加钟率、退单率、退单数量、总订单量等数据,更加直观的查看......
  • 在Linux中,开源的优势是什么?
    在Linux中,开源的优势主要包括自由访问和修改源代码、易于定制和高度模块化、高安全性和稳定性、支持多用户和多任务、免费使用和广泛的硬件支持等。具体如下:自由访问和修改源代码:开源意味着任何个人或组织都可以自由地访问源代码。这为全球的开发者提供了一个共同工作和改进同......
  • 跟着GPT学习Java线程中断机制
    Java中的线程中断是一个复杂但非常重要的概念,它允许一个线程告知另一个线程希望它停止正在做的事情。这个机制是协作式的,意味着被请求中断的线程需要自己检查中断状态,并且决定如何响应中断请求。下面我将系统地讲解Java中的线程中断知识点。 1.中断标志每个线程都有一个内部......
  • ChatTTS 开源文本转语音模型本地部署、API使用和搭建WebUI界面(建议收藏)
    ChatTTS(ChatTextToSpeech)是专为对话场景设计的文本生成语音(TTS)模型,特别适用于大型语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。它支持中文和英文,还可以穿插笑声、说话间的停顿、以及语气词等,听起来很真实自然,在语音合成中表现出高质量和自然度(ChatTTS团......
  • ChatGPT Prompt技术全攻略-探索篇:前沿Prompt工程技术
    系列篇章......
  • 深入浅出,解析ChatGPT背后的工作原理
    自ChatGPT发布以来,已经吸引了无数人一探究竟。但ChatGPT实际上是如何工作的?尽管它内部实现的细节尚未公布,我们却可以从最近的研究中一窥它的基本原理。ChatGPT是OpenAI发布的最新语言模型,比其前身GPT-3有显著提升。与许多大型语言模型类似,ChatGPT能以不同样式、不......
  • 40.8K开源交流社区平台:Discourse
    Discourse:开放源代码,打造社区讨论的自由家园-精选真开源,释放新价值。概览Discourse是一个完全开源的社区平台,为那些希望完全控制自己网站运行方式和地点的组织和个人提供服务。经过十多年的实战考验,Discourse不断演进,满足用户对于强大社区平台的需求。它支持创建讨论话......
  • 小爱同学接入ChatGPT
    用到的工具:1,Xiaogpt(感谢yihong0618):https://github.com/yihong0618/xiaogpt2,MiService(感谢Yonsm&yihong0618):https://github.com/Yonsm/MiServiceorhttps://github.com/yihong0618/MiService3,小爱音响(我这里用的是L05C,这个型号在设备底部铭牌上)4,一个安装了python3.8+,以及Pip的......
  • GPT-4o多模态处理能力解析:AI技术的新高度
     GPT-4o模型在2024年5月14日被宣布推出,具有多项引人注目的特点与功能。能够支持文本、音频和图像的任意组合输入,并生成相应的文本、音频和图像输出。它在视觉和音频理解方面尤其出色,可以实时对音频、视觉和文本进行推理。相比之前的模型,GPT-4o在速度上有了显著的提升,例如,它可......
  • 本地部署GLM-4-9B清华智谱开源大模型方法和对话效果体验
    GLM-4-9B是清华大学和智谱AI推出的最新一代预训练模型GLM-4系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B及其人类偏好对齐的版本GLM-4-9B-Chat均表现出较高的性能,其通用能力评测结果甚至超越了Llama-3-8B开源大模型,多模态版本也与GPT-4版本齐......