我也玩大模型-私有化部署

时间：2023-07-05 18:33:59浏览次数：50

标签：睡眠部署模型私有化 huggingface chatglm response history

　　chatGPT带火了整个AI，本来想让子弹飞会，但上上下下都在谈论，感觉很焦虑。那就试试吧。

1、选型，只有开源的才可能私有化部署，最终从最容易入手的（资料做多）：清华开源的chatGLM2-6B，毕竟现在是练手

2、项目：github上有，huggingface上也有，但不一样。完整的模型实现在huggingface，带着模型参数。

3、模型：模型可以通过安装git LFS后下载。也可以在clone huggingface上的工程后，用迅雷去huggingface上下载7个bin文件（11.6G），以及ice_text.model文件。这几个文件普通的git clone下来的是一个链接。huggingface上标注为LFS的都需要另外下，否则后面加载模型时会报错。另外，还可以从清华大学云盘上去下：https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/

4、依赖：根据github上的requirements.txt：protobuf transformers==4.30.2 cpm_kernels torch>=2.0 gradio mdtex2html sentencepiece accelerate sse-starlette。除非你非常清楚依赖之间的版本关系，否则请按要求的去做

5、完成部署：clone完huggingface项目，下载完模型参数，安装完依赖，就完成部署了。如果后面跑脚本报错，大概率是下载的文件不全或依赖没装全。

6、代码调用：假设项目部署在/home/app/chatglm-6b目录下，下面的代码将从本地加载模型，如果使用路径"THUDM/chatglm-6b"，将需要从huggingface加载模型，很可能因为网络问题而下载不了模型（11.6G的bin文件）。

>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("/home/app/chatglm-6b", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("/home/app/chatglm-6b", trust_remote_code=True).half().cuda()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好
标签：睡眠,部署,模型,私有化,huggingface,chatglm,response,history	

From： https://www.cnblogs.com/badwood316/p/17527148.html

使用docker-compose部署apollo配置中心
docker-compose部署apollo配置中心1、Apollo配置中心1.1、Apollo简介Apollo（阿波罗）是携程框架部门研发的开源配置管理中心，能够集中化管理应用不同环境、不同集群的配置，配置修改后能够实时推送到应用端，并且具备规范的权限、流程治理等特性。Apollo支持4个维度管理Key-Value格式......
SpringMVC框架详解：模型+核心组件+实现原理等详解
MVC模型SpringMVC基于MVC模式，因此理解SpringMVC需要先对MVC模式有所了解。MVC是model、view、和controller的缩写，是软件开发中一种常用的架构模式。MVC各部分根据职责进行分离，使程序的结构更为直观，增加了程序的可扩展性、可维护性、可复用性。可以用如下的图形来......
MongoDB数据库部署与应用
MongoDB数据库部署与应用拓扑图：推荐步骤：在Centos01上安装mongoDB数据库管理mongoDB服务生成MongoDB配置文件通过控制文件控制MongoDB服务，配置MongoDB身份验证配置mongoDB身份验证管理和修改配置文件支持验证配置mongoDB基本管理配置MongoDB数据备份恢复实验步骤：一．在Centos01上安装m......
使用docker部署pg集群（postgresql+postgis+pgrouting+pgpool）
使用docker部署pg集群（postgresql+postgis+pgrouting+pgpool）1，安装dockeryuminstalldocker2，拉取docker容器dockerpullhub-mirror.c.163.com/bitnami/postgresql-repmgr:15dockerpullhub-mirror.c.163.com/bitnami/pgpool:latest3，启动数据库1，创建文件夹并赋予权限cd......
利用ansible批量部署node客户端，并注册consul，实现主机自动发现
1.在管理机器上搭建consul并上传 node_exoporter软件包，system服务配置文件，注册脚本 2.利用ansible对指定机器去分发软件包并启动服务，并curl注册到consul 编写为node-exporter.yml 3.prometheus配置consul地址，获取主机信息，自动发现并配合grafana展示 system......
redis用docker 部署主从
dockerpullrediscd/home/softmkdir-predis/configmkdir-predis/data/data6379redis/data/data6380redis/data/data6381cd/home/soft/redis/configviredis6379.conf:port6379viredis6380.conf:#节点容器端口port6380#宿主机ip、master端口replicaof192.168.1......
建筑师们，你们该把模型弄到PPT里做汇报了！
➤如何实现项目汇报效率比传统的PPT高，同时汇报效果更直观？➤如何摆脱方案汇报只能向客户交付数据，安装专业软件查看项目成果？➤如何将无人机航测数据、CAD图纸、BIM设计成果进行融合，挖掘出更深层次的应用？➤如何创建一个高大上的实景三维展示系统向甲方进行工作汇报？ ......
kubesphere devops部署springboot项目
一：使用流水线devops部署springboot项目的流程：二、本次项目结构：其中Dockerfile:FROMopenjdk:8-jdkLABELmaintainer=leifengyang#dockerrun-ePARAMS="--server.port9090"ENVPARAMS="--server.port=8080"RUN/bin/cp/usr/share/zoneinfo/Asia/Shanghai/et......
Oracle 11g RAC部署
Oracle11gRAC部署操作环境：CentOS7.4+Oracle11.2.0.4一、主机网络规划网络配置节点1节点2主机名称rac1rac2publicip10.0.0.2110.0.0.22privateip172.16.1.21172.16.1.22vip10.0.0.2310.0.0.24scanip10.0.0.25PublicIP：服务器......
【Netty】「萌新入门」（四）异步编程模型：利用 Future 和 Promise 提高性能与响应能力
前言本篇博文是《从0到1学习Netty》中入门系列的第四篇博文，主要内容是介绍Netty中Future与Promise的使用，通过使用异步的方式提高程序的性能和响应速度，往期系列文章请访问博主的Netty专栏，博文中的所有代码全部收集在博主的GitHub仓库中；为什么要使用异步？使用异步编程模式......

我也玩大模型-私有化部署

相关文章

赞助商

阅读排行