首页 > 其他分享 >我也玩大模型-私有化部署

我也玩大模型-私有化部署

时间:2023-07-05 18:33:59浏览次数:44  
标签:睡眠 部署 模型 私有化 huggingface chatglm response history

  chatGPT带火了整个AI,本来想让子弹飞会,但上上下下都在谈论,感觉很焦虑。那就试试吧。

1、选型,只有开源的才可能私有化部署,最终从最容易入手的(资料做多):清华开源的chatGLM2-6B,毕竟现在是练手

2、项目:github上有,huggingface上也有,但不一样。完整的模型实现在huggingface,带着模型参数。

3、模型:模型可以通过安装git LFS后下载。也可以在clone huggingface上的工程后,用迅雷去huggingface上下载7个bin文件(11.6G),以及ice_text.model文件。这几个文件普通的git clone下来的是一个链接。huggingface上标注为LFS的都需要另外下,否则后面加载模型时会报错。另外,还可以从清华大学云盘上去下:https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/

4、依赖:根据github上的requirements.txt:protobuf transformers==4.30.2 cpm_kernels torch>=2.0 gradio mdtex2html sentencepiece accelerate sse-starlette。除非你非常清楚依赖之间的版本关系,否则请按要求的去做

5、完成部署:clone完huggingface项目,下载完模型参数,安装完依赖,就完成部署了。如果后面跑脚本报错,大概率是下载的文件不全或依赖没装全。

6、代码调用:假设项目部署在/home/app/chatglm-6b目录下,下面的代码将从本地加载模型,如果使用路径"THUDM/chatglm-6b",将需要从huggingface加载模型,很可能因为网络问题而下载不了模型(11.6G的bin文件)。

>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("/home/app/chatglm-6b", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("/home/app/chatglm-6b", trust_remote_code=True).half().cuda()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好

标签:睡眠,部署,模型,私有化,huggingface,chatglm,response,history
From: https://www.cnblogs.com/badwood316/p/17527148.html

相关文章

  • 使用docker-compose部署apollo配置中心
    docker-compose部署apollo配置中心1、Apollo配置中心1.1、Apollo简介Apollo(阿波罗)是携程框架部门研发的开源配置管理中心,能够集中化管理应用不同环境、不同集群的配置,配置修改后能够实时推送到应用端,并且具备规范的权限、流程治理等特性。Apollo支持4个维度管理Key-Value格式......
  • SpringMVC框架详解:模型+核心组件+实现原理等详解
     MVC模型SpringMVC基于MVC模式,因此理解SpringMVC需要先对MVC模式有所了解。MVC是model、view、和controller的缩写,是软件开发中一种常用的架构模式。MVC各部分根据职责进行分离,使程序的结构更为直观,增加了程序的可扩展性、可维护性、可复用性。可以用如下的图形来......
  • MongoDB数据库部署与应用
    MongoDB数据库部署与应用拓扑图:推荐步骤:在Centos01上安装mongoDB数据库管理mongoDB服务生成MongoDB配置文件通过控制文件控制MongoDB服务,配置MongoDB身份验证配置mongoDB身份验证管理和修改配置文件支持验证配置mongoDB基本管理配置MongoDB数据备份恢复实验步骤:一.在Centos01上安装m......
  • 使用docker部署pg集群(postgresql+postgis+pgrouting+pgpool)
    使用docker部署pg集群(postgresql+postgis+pgrouting+pgpool)1,安装dockeryuminstalldocker2,拉取docker容器dockerpullhub-mirror.c.163.com/bitnami/postgresql-repmgr:15dockerpullhub-mirror.c.163.com/bitnami/pgpool:latest3,启动数据库1,创建文件夹并赋予权限cd......
  • 利用ansible批量部署node客户端,并注册consul,实现主机自动发现
      1.在管理机器上搭建consul并上传 node_exoporter软件包,system服务配置文件,注册脚本 2.利用ansible对指定机器去分发软件包并启动服务,并curl注册到consul  编写为node-exporter.yml 3.prometheus配置consul地址,获取主机信息,自动发现并配合grafana展示  system......
  • redis用docker 部署主从
    dockerpullrediscd/home/softmkdir-predis/configmkdir-predis/data/data6379redis/data/data6380redis/data/data6381cd/home/soft/redis/configviredis6379.conf:port6379viredis6380.conf:#节点容器端口port6380#宿主机ip、master端口replicaof192.168.1......
  • 建筑师们,你们该把模型弄到PPT里做汇报了!
    ➤如何实现项目汇报效率比传统的PPT高,同时汇报效果更直观?➤如何摆脱方案汇报只能向客户交付数据,安装专业软件查看项目成果?➤如何将无人机航测数据、CAD图纸、BIM设计成果进行融合,挖掘出更深层次的应用?➤如何创建一个高大上的实景三维展示系统向甲方进行工作汇报?     ......
  • kubesphere devops部署springboot项目
    一:使用流水线devops部署springboot项目的流程: 二、本次项目结构: 其中Dockerfile:FROMopenjdk:8-jdkLABELmaintainer=leifengyang#dockerrun-ePARAMS="--server.port9090"ENVPARAMS="--server.port=8080"RUN/bin/cp/usr/share/zoneinfo/Asia/Shanghai/et......
  • Oracle 11g RAC部署
    Oracle11gRAC部署操作环境:CentOS7.4+Oracle11.2.0.4一、主机网络规划网络配置节点1节点2主机名称rac1rac2publicip10.0.0.2110.0.0.22privateip172.16.1.21172.16.1.22vip10.0.0.2310.0.0.24scanip10.0.0.25PublicIP:服务器......
  • 【Netty】「萌新入门」(四)异步编程模型:利用 Future 和 Promise 提高性能与响应能力
    前言本篇博文是《从0到1学习Netty》中入门系列的第四篇博文,主要内容是介绍Netty中Future与Promise的使用,通过使用异步的方式提高程序的性能和响应速度,往期系列文章请访问博主的Netty专栏,博文中的所有代码全部收集在博主的GitHub仓库中;为什么要使用异步?使用异步编程模式......