首页 > 其他分享 >给vllm添加热添加lora的功能

给vllm添加热添加lora的功能

时间:2024-06-02 15:34:02浏览次数:14  
标签:request add 添加 AddLoraRequest vllm lora

写在前面

原生vllm并不支持热添加lora,但是考虑到微调机微调后,需要在不停机的情况下传递lora,于是我们需要增加一个逻辑

修改VLLM包中的vllm/entrypoints/openai/api_server.py文件,添加下方的代码:

 1 from pydantic import BaseModel
 2 
 3 class AddLoraRequest(BaseModel):
 4     lora_name: str
 5     lora_local_path: str
 6 
 7 @app.get("/add_lora")
 8 async def add_lora(request: AddLoraRequest):
 9     openai_serving_chat.add_lora(request.lora_name, request.lora_local_path)
10     return Response(status_code=200)

 

标签:request,add,添加,AddLoraRequest,vllm,lora
From: https://www.cnblogs.com/alphainf/p/18227171

相关文章

  • ubuntu添加自启动
    原创不易,转载请注明来源,谢谢创建脚本web#!/bin/bash#chkconfig:23455525#description:btCloudService###BEGININITINFO#Provides:web#Required-Start:$all#Required-Stop:$all#Default-Start:2345#Default-Stop:......
  • QT添加样式表QSS/CSS文件后不起作用
    .qss和.css文件类似,CSS即层叠样式表(CascadingStyleSheets)可以修改组件的样式。在QT项目需要.css文件对组件进行样式设置,在qrc文件夹下添加文件之后,读取会失败,原因是添加文件需要点击添加现有文件,尽管所需文件在某个目录下,也不要选择添加目录。分别使用绝对路径、相对路径添......
  • 饮料添加剂新型褪色光照试验仪器太阳光模拟器
    太阳光模拟器的定义和功能太阳光模拟器是一种高科技设备,它可以模拟太阳光的光谱、光强和光照条件,用于实验室环境中对太阳能电池、光电器件以及其他需要太阳光条件的设备和材料进行评估。太阳光模拟器的主要功能包括模拟太阳光的光谱分布、辐照度、光束准直以及大面积照射能力,......
  • YOLOv8改进 | 卷积模块 | 添加选择性内核SKConv【附完整代码一键运行】
    ......
  • LLM 大模型学习必知必会系列(十二):VLLM性能飞跃部署实践:从推理加速到高效部署的全方位
    LLM大模型学习必知必会系列(十二):VLLM性能飞跃部署实践:从推理加速到高效部署的全方位优化[更多内容:XInference/FastChat等框架]训练后的模型会用于推理或者部署。推理即使用模型用输入获得输出的过程,部署是将模型发布到恒定运行的环境中推理的过程。一般来说,LLM的推理可以直接使......
  • LLM 大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战
    LLM大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战1.环境准备GPU设备:A10,3090,V100,A100均可.#设置pip全局镜像(加速下载)pipconfigsetglobal.index-urlhttps://mirrors.aliyun.com/pypi/simple/#安装ms-swiftpipinstall'ms-swift[llm]'-U......
  • R语言中绘制弧形箭头并添加文字
     001、测试01library(ggplot2)ggplot(data.frame(x=c(1,3),y=c(1,3)),aes(x=x,y=y))+geom_point()+geom_curve(aes(x=1.5,y=2.5,xend=2.6,yend=2.6),##绘制弧形箭头curvature=0.3,size=5,col="red",......
  • 山东大学项目实训-基于LLM的中文法律文书生成系统(十七)- 微调-LoRA(2)
    LoRALORA是一种低资源微调大模型方法,出自论文LoRA:Low-RankAdaptationofLargeLanguageModels。使用LORA,训练参数仅为整体参数的万分之一、GPU显存使用量减少2/3且不会引入额外的推理耗时。自然语言处理的一个重要范式包括对一般领域数据的大规模预训练和对特定任务或领......
  • 通过C#给图片添加水印
    近日有图片通过C#加水印的需求,在网上搜到了这个:https://www.jb51.net/program/319824nmi.htm但是提供的代码有不少问题。经过分析和修改,整理为了这样的代码:oldpath为原图片路径,newpath为保存到的图片路径。text为水印文字内容。rotate是以°为单位的角度,repeatD是垂直或水平相邻......
  • nuget添加readme
    提问nuget如何添加readme回答目录csproj其他nuget最佳实践https://learn.microsoft.com/en-us/nuget/create-packages/package-authoring-best-practices......