以容器方式部署通义千问 Qwen

时间：2024-02-09 18:11:20浏览次数：28

标签：千问 -- Qwen install nvidia model docker dir 通义

准备服务器

阿里云云服务器
实例规格：轻量级 GPU 实例 ecs.vgn6i-m4-vws.xlarge（4vCPU 23GiB）
磁盘空间：50G
操作系统：Ubuntu 22.04

安装 docker

apt install docker.io

安装 NVIDIA GRID 驱动

acs-plugin-manager --exec --plugin grid_driver_install

安装 NVIDIA Container Toolkit

安装命令

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
apt-get update
apt-get install -y nvidia-container-toolkit

配置命令

nvidia-ctk runtime configure --runtime=docker
systemctl restart docker

验证是否安装成功

docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi

下载 model checkpoint

创建下载脚本 download-model-checkpoint.py

from modelscope import snapshot_download
from transformers import AutoModelForCausalLM, AutoTokenizer

# Downloading model checkpoint to a local dir model_dir
model_dir = snapshot_download('qwen/Qwen-7B-Chat')

# Loading local checkpoints
# trust_remote_code is still set as True since we still load codes from local dir instead of transformers
tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_dir,
    device_map="auto",
    trust_remote_code=True
).eval()

安装脚本依赖包

pip install modelscope
pip install transformers
pip install torch
pip install tiktoken
pip install transformers_stream_generator
pip install accelerate

执行脚本下载 model checkpoints

python3 download-model-checkpoint.py

注：model checkpoints 文件会被下载到 ~/.cache/modelscope/hub/qwen/Qwen-7B-Chat 文件夹中（这个路径就是 model_dir 变量的值）。

启动容器运行模型服务（OpenAI API 兼容方式）

签出通义千问的开源代码

git clone https://github.com/QwenLM/Qwen.git

使用下面的脚本启动容器

IMAGE_NAME=qwenllm/qwen:cu114
PORT=8901
CHECKPOINT_PATH=~/.cache/modelscope/hub/qwen/Qwen-7B-Chat
bash docker/docker_openai_api.sh -i ${IMAGE_NAME} -c ${CHECKPOINT_PATH} --port ${PORT}

注：qwenllm/qwen:cu114 镜像文件大小为 9.87G

确认容器是否启动成功

# docker ps
CONTAINER ID   IMAGE                COMMAND                  CREATED         STATUS         PORTS                                   NAMES
b2bd3f3417af   qwenllm/qwen:cu114   "/opt/nvidia/nvidia_…"   3 minutes ago   Up 3 minutes   0.0.0.0:8901->80/tcp, :::8901->80/tcp   qwen

启动成功！

确认 api 是否可以正常请求

# curl localhost:8901/v1/models | jq

输出内容

{
  "object": "list",
  "data": [
    {
      "id": "gpt-3.5-turbo",
      "object": "model",
      "created": 1707471911,
      "owned_by": "owner",
      "root": null,
      "parent": null,
      "permission": null
    }
  ]
}

请求成功！可以正常兼容 openai 的 api。

标签：千问,--,Qwen,install,nvidia,model,docker,dir,通义
From： https://www.cnblogs.com/dudu/p/18008693

通义千问上线春节新应用，AI帮你免费拍全家福
2月5日，春节将至年味渐浓，阿里云通义千问APP上线多项免费新应用，涵盖全家福、拜新年、万物成龙等图像生成的新玩法，共提供超300套照片模板，用户上传照片即可生成全家福、团圆照、拜年照、千里江山主题照；此外，一个月前火爆全网的全民舞王应用也迎来上新，用户可通过一张照片生成拜年视频，用更......
国内唯一！通义灵码入选全球智能编码助手使用率 TOP 榜单
近日，在国内知名科技媒体InfoQ研究中心发布的《中国软件技术发展洞察和趋势预测报告2024》中提到，随着AI和大模型技术的普及，开发者智能编码助手的使用习惯已经养成，其中，开发者使用的智能编码助手产品使用率超过10%的产品共计8款，唯一一款国内企业研发的产品为阿里旗下的通义......
通义灵码——灵动指间，快码加编，你的智能编码助手
通义灵码，是阿里云出品的一款基于通义大模型的智能编码辅助工具，提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力，并针对阿里云的云服务使用场景调优，助力开发者高效、流畅的编码。点击此处立即参与通义灵......
通义灵码——灵动指间，快码加编，你的智能编码助手
通义灵码，是阿里云出品的一款基于通义大模型的智能编码辅助工具，提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力，并针对阿里云的云服务使用场景调优，助力开发者高效、流畅的编码。点击此处立即参与通义......
通义灵码试用
参考：通义灵码官方一通义灵码是什么二安装通义灵码三通义灵码的使用四问题一通义灵码是什么看博客园的首页推荐，来尝试下这个编码助手咋回事。通义灵码是阿里出的编码助手，基于通义大模型，提供代码AI智能生成、研发智能问答。提供功能：行/函数级实时续写自然语言......
阿里云参编业内首个代码大模型标准，通义灵码获 2023 AI4SE “银弹” 案例
日前，中国人工智能产业发展联盟智能化软件工程工作组（AIforSoftwareEngineering，下文简称AI4SE）在京召开首届“AI4SE创新巡航”活动。阿里云作为AI4SE首批成员单位，与中国信息通信研究院等组织联合发起的《智能化软件工程技术和应用要求第一部分：代码大模型》（标准编号AIIA/PG0110......
通义灵码，降临博客园
阿里云通义灵码昨天开始在园子里投放广告啦——灵动指间，快码加编，你的智能编码助手！在园子的脱困阶段，我们一边在做会员，一边在卖周边，一边也想做一些高品质广告单，这周终于等到一单。但这一单只是短期试投，投放一周左右，然后评估投放效果，如果效果好，通义灵码会考虑和园子长期合作。......
阿里发布通义千问！1行代码，免费对话GPT大模型
大家好，这里是程序员晚枫，今天给大家分享一个好用的东西......
阿里云的通义灵码在 IDEA 使用
序章官网：https://tongyi.aliyun.com/lingma介绍：基于通义大模型，提供代码智能生成、研发智能问答能力。使用手册：https://help.aliyun.com/document_detail/2590615.html IDEA版本：IntelliJIDEA2023.1.1(CommunityEdition)通义灵码版本：1.1.0 安装通义灵码插......
不需要本地部署大模型，modelscope-agent加qwen-max免费搭建自己的定制机器人
最近阿里开源了通用大模型qwen-72b,正在为怎么本地化部署发愁，转眼看到提供了qwen-max相关接口的免费试用（据说就是基于qwen-72b大模型)，这就来体验一番。1.前期准备开通阿里云灵积平台，并创建api-key2.环境搭建python:3.10+；pydantic2.0以上,老版本pydantic会报一个tool_sche......