首页 > 其他分享 >部署ChatGLM6B模型过程

部署ChatGLM6B模型过程

时间:2023-05-08 21:14:47浏览次数:44  
标签:插件 部署 模型 6b cu117 https chatglm ChatGLM6B

背景

大语言模型的本地化部署尝试

步骤

  1. 下载项目
    下载页:https://github.com/josStorer/selfhostedAI/releases/tag/v2
    下载selfhostedAI-chatglm-6b-int4-widoowed-nvidia.7z.001-003压缩包

  2. 解压后,更新项目:
    update.bat

  3. 安装pytorch for gpu
    pip install torch1.13.1+cu117 torchvision0.14.1+cu117 --extra-index-url https://download.pytorch.org/whl/cu117

  4. 启动
    chatglm-6b-int4.bat

  5. 启动成功

  6. 使用方法-使用chrome的插件
    下载地址:https://github.com/josStorer/chatGPTBox/releases/tag/v2.3.0
    下载chromium-without-katex-and-tiktoken.zip
    打开chrome的扩展管理,将解压的文件加载到插件系统中,在插件列表打开设置
    API模式-自定义模型
    模型名称-chatglm-6b-int4
    模型地址-http://localhost:8000/chat/completions
    就可以开始使用了

标签:插件,部署,模型,6b,cu117,https,chatglm,ChatGLM6B
From: https://www.cnblogs.com/terrency/p/17383143.html

相关文章

  • skywalking 集群部署
    1、安装包:apache-skywalking-apm-es7-8.7.0.tar.gz下载地址:https://archive.apache.org/dist/skywalking/8.7.0/apache-skywalking-apm-es7-8.7.0.tar.gz2、安装包解压tar -xf  apache-skywalking-apm-es7-8.7.0.tar.gzyuminstalljava-1.8.0-openjdk-devel-y  ......
  • ChatGLM-6B本地化部署
    一、硬件要求量化等级最低GPU显存(推理)最低GPU显存(高效参数微调)FP16(无量化)13GB14GBINT88GB9GBINT46GB7GB二、环境要求需先安装git、python三、下载源码1mkdir/gpt2cdgpt3gitclonehttps://github.com/THUDM/ChatGLM-6B.git ......
  • Java 中的机器学习正在加速图像处理 Java 开发人员可以使用预训练的机器学习模型快速
    来源: https://www.infoworld.com/article/3601711/machine-learning-in-java-is-speeding-image-processing.html 近年来,人们对机器学习的兴趣稳步增长。具体来说,企业现在在各种用例中使用机器学习进行图像识别。在 汽车行业、 医疗保健、 安全、 零售、 仓库中的自动化......
  • 用Python语言进行时间序列ARIMA模型分析
    应用时间序列时间序列分析是一种重要的数据分析方法,应用广泛。以下列举了几个时间序列分析的应用场景:1.经济预测:时间序列分析可以用来分析经济数据,预测未来经济趋势和走向。例如,利用历史股市数据和经济指标进行时间序列分析,可以预测未来股市的走向。2.交通拥堵预测:时间......
  • 阿里云部署freeswitch的公网ip问题,nat穿越问题
    关于阿里云安装freeswitch的内容请参见本人另一篇博文。ubuntu14.04lts安装freeswitch这里把困扰本人很久的问题,阿里云使用“专有网络”后,系统获取公网ip错误,导致freeswitch无法连接及打通电话的问题解决方法记录一下:1、在var.xml中修改<!--X-PRE-PROCESScmd="stun-set"dat......
  • java内存模型&synchronized和volatile在jmm上的区别
    转载:https://www.bilibili.com/video/BV1B24y1T7Qp/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=46d50b5d646b50dcb2a208d3946b1598......
  • Vmware ESXi 5.0 安装与部署
    在虚拟化领域VMware、Citrix、Microsoft都有不错的解决方案而在服务器虚拟化领域VMware又占据着领导者地位游侠www.2cto.com今天也装了个平台与大家一起分享。VMware的虚拟化产品就个人、小企业而言有Workstation、ESXivSphere免费版、VMwareServer免费版可以选择由于Workstat......
  • 全阶滑模无位置传感器控制仿真模型,有基本的反正切的,有锁相环的,有基本的开关函数,有饱和
    全阶滑模无位置传感器控制仿真模型,有基本的反正切的,有锁相环的,有基本的开关函数,有饱和函数,sigmod函数,以及幂函数多种滑模。还有全阶滑模观测器仿真,相比传统滑模观测器消除了额外的低通滤波器,误差更小,效果堪称完美。不仅误差小,脉动也少。(单独)还有基于扩张状态观测器的锁相环esopll......
  • IO模型
    IO模型介绍为了更好地了解IO模型,我们需要事先回顾下:同步、异步、阻塞、非阻塞同步(synchronous)IO和异步(asynchronous)IO,阻塞(blocking)IO和非阻塞(non-blocking)IO分别是什么,到底有什么区别?这个问题其实不同的人给出的答案都可能不同,比如wiki,就认为asynchronousIO和non-blocki......
  • 多模态+大模型领域的开源数据集(持续更新中20230508)
     ConceptualCaption简称cc,minigpt4就使用这个数据集,一个大规模的图像文本配对数据集,包含超过30万个图像,每个图像都有5个人工描述。这个数据集的目的是为了促进计算机视觉和自然语言处理之间的研究交叉,可以用于图像检索、视觉问答等任务的训练和评估。ConceptualCaptions为......