vllm docker-compose

时间：2024-11-18 10:33:05浏览次数：1

标签：compose hitvideos -- models moonlit docker vllm model

version: '3'

services:
  moonlit-vllm-qwen-hotvideo:
    image: vllm/vllm-openai:v0.6.2
    container_name: hitvideos_api
    restart: always
    command: [
      "--served-model-name", "qwen2.5-14b-hitvideos",
        "--model", "/root/models/Qwen2.5-14B-Insruct-GPTQ-Int4-1113",
#        "--api-key", "sk-zZVAfGSXnGjVpYT127Cf5aD420F648F1826355455eEaD881",
#        "--max-model-len", "512",
        "--tool-call-parser", "hermes",
        "--enable-auto-tool-choice",
        "--enforce_eager",
         "--gpu-memory-utilization","0.5",
#        "--max_num_seqs","256",
        "--cpu-offload-gb","2"
    ]
    volumes:
      - /data/preview/base/models/SFT/hitvideos:/root/models
    ports:
      - "11110:8000"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              capabilities: [ gpu ]
              device_ids: ['0']
    environment:
      TZ: Asia/Shanghai
#    networks:
#      - moonlit-vllm
#
#networks:
#    moonlit-vllm:
#        external: true

标签：compose,hitvideos,--,models,moonlit,docker,vllm,model
From： https://www.cnblogs.com/Gimm/p/18551951

docker 运维
服务器公网IP113.45.148.176mysql初始数据卷设置my.cnf[client]default-character-set=utf8mb4[mysql]default-character-set=utf8mb4[mysqld]character-set-client-handshake=FALSEcharacter-set-server=utf8mb4collation-server=utf8mb4_unicode_ci#collation......
为正在运行的 Docker 容器重启策略,以提高服务的可用性
为正在运行的Docker容器重启策略,以提高服务的可用性。为正在运行的Docker容器添加--restart=always--restart=always是Docker中一个常用的参数，用来设置容器的重启策略。它的作用是确保容器在一定条件下能够自动重启，以提高服务的可用性。方法：直接修改配置步骤1：查看......
【模型部署】vLLM 部署 Qwen2-VL 踩坑记 02 - 推理加速
【模型部署】vLLM部署Qwen2-VL踩坑记02-推理加速NLPGithub项目：NLP项目实践：fasterai/nlp-project-practice介绍：该仓库围绕着NLP任务模型的设计、训练、优化、部署和应用，分享大模型算法工程师的日常工作和实战经验AI藏经阁：https://gitee.com/fasterai/ai-e-book......
使用 Docker 部署 Next Terminal 轻量级堡垒机
1）NextTerminal 介绍官网：https://next-terminal.typesafe.cn/GitHub：https://github.com/dushixiang/next-terminal想必经常玩服务器的都了解过堡垒机，类似于跳板机，但与跳板机的侧重点不同。堡垒机的主要功能是控制和监控对内部网络的远程访问。它提供严格的访问控制、会话审......
docker运行rabbitmq，mq用户以及vhost的持久化方法
一、编写dockerfile文件，配置需要的插件vimpackage/dockerfile-rabbitmq.yamlFROMrabbitmq:3.8.5WORKDIR/var/lib/rabbitmqCOPYrabbitmq_delayed_message_exchange-3.8.0.ez/opt/rabbitmq/plugins/RUNchownrabbitmq:rabbitmq/opt/rabbitmq/plugins/rabbitmq_delayed_......
Docker部署Redis哨兵
哨兵，英文名Sentinel，是一个分布式系统，用于对主从结构中的每一台服务器进行监控，当主节点出现故障后通过投票机制来挑选新的主节点，并且将所有的从节点连接到新的主节点上。RedisSentinel包含若干个Sentinel节点和Redis数据节点，每个Sentinel节点会对数据节点和其余Senti......
docker安装单机版redis
Docker安装Redis方法一、dockerpullredis查找DockerHub上的redis镜像#dockersearchredis这里我们拉取官方的镜像,标签为latest#dockerpullredis:latest（第一次启动Docker-Redis主要是查看Docker里面Redis的默认配置，数据位置，日志位置，配置文件位置）#dockerrun-it......
docker容器镜像的制作、使用以及传递
目录制作容器镜像使用Dockerfile制作镜像准备所需文件构建镜像怎么不使用基础镜像来构建容器镜像使用容器镜像传递容器镜像这篇文章讨论一下怎么使用docker制作容器镜像，容器镜像的使用，以及怎么传递容器镜像。制作容器镜像docker制作容器镜像推荐的方法就是使用Doc......
快速上手：Docker 安装详细教程（适用于 Windows、macOS、Linux）
###快速上手：Docker安装详细教程（适用于Windows、macOS、Linux）---Docker是一款开源容器化平台，广泛应用于开发、测试和部署。本文将为您提供分步骤的Docker安装教程，涵盖Windows、macOS和Linux系统。---##**一、Docker安装前的准备工作**在安装Docker之前，确保满......
docker busybox作为initContainers
一、上传到私有仓储dockerpullbusybox:1.33.1dockertagbusybox:1.33.1192.168.31.185/public/busybox:1.33.1dockerpush192.168.31.185/public/busybox:1.33.1---apiVersion:apps/v1kind:Deploymentspec:containers:-env:......

vllm docker-compose

相关文章

赞助商

阅读排行