首页 > 其他分享 >SGLang 大模型推理框架 qwen2部署使用案例;openai接口调用、requests调用

SGLang 大模型推理框架 qwen2部署使用案例;openai接口调用、requests调用

时间:2024-07-27 15:55:29浏览次数:9  
标签:调用 qwen2 top flashinfer sampling SGLang install pip sglang

参考:
https://github.com/sgl-project/sglang
纯python写,号称比vllm、tensorRT还快
在这里插入图片描述
暂时支持模型
在这里插入图片描述

安装

可以pip、源码、docker安装,这里用的pip

注意flashinfer安装最新版,不然会可能出错误ImportError: cannot import name ‘top_k_top_p_sampling_from_probs’ from ‘flashinfer.sampling’

pip install --upgrade pip
pip install "sglang[all]"

# Install FlashInfer CUDA kernels
pip install  -U flashinfer 

标签:调用,qwen2,top,flashinfer,sampling,SGLang,install,pip,sglang
From: https://blog.csdn.net/weixin_42357472/article/details/140735063

相关文章

  • C# 通过反射(Reflection)调用不同名泛型方法
    概述由于工作需要,需要通过数据类型和方法名控制方法走向用到的数据类型有8种(string,Int16,Int32,Int64,Boolean,Byte,Single,Double)读取的方法(参数一致,但是数据不同的泛型方法,返回值也是泛型)暂时只有11种,但肯定的是,后续一定会增加原本计划排列组合,写个88行代码,但是总觉得重复......
  • 函数调用结束后如何恢复调用前的现场
    函数调用结束后,恢复调用前的现场是一个涉及堆栈操作的重要过程。这个过程主要依赖于硬件栈(如x86架构中的栈)来保存和恢复函数的执行状态。以下是详细的恢复步骤:1.堆栈的作用在函数调用过程中,堆栈(Stack)被用来存储局部变量、函数参数以及函数的返回地址等信息。每个函数调用都......
  • crontab 运行 .sh 文件调用 python 脚本
    我有一个pythonselenium脚本,可以打开chrome并为我运行一些自动化任务。在crontab中直接调用python可以使用下面的行。:10.0是我运行echo$DISPLAY时得到的值。我使用的是Ubuntu22.04.4LTS5823**2DISPLAY=:10.0/usr/bin/python3/home/user/Script......
  • Vue3 - 最新详细实现网站接入Google谷歌授权登录配置流程及示例代码教程,手机移动端、p
    前言如果您需要Vue2版本,请访问这篇文章。在vue3|nuxt3网站开发中,详解实现vue3接入新版google谷歌快捷登录教程,电脑PC网站、手机网站集成谷歌授权登录服务及拿到用户个人信息头像邮箱等,国内第三方web站点使用google账号登陆及授权重定向,提供详细的本地调试方法以......
  • 【Azure APIM】调用APIM的备份接口时候遇见InvalidParameters错误
    问题描述根据官方文档,可以调用RESTAPI来对APIM执行备份操作。要备份API管理服务,请发出以下HTTP请求:POSThttps://management.chinacloudapi.cn/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ApiManagement/service/{serviceN......
  • C#调用C++的dll方法
    C#调用C++的dll方法有时候用一些硬件厂家的库函数,厂家没有支持C#的,就只有C、C++语言,这个时候只能将C、C++编译成dll文件,然后用C#来调用这些接口。下面使用环境为vs2010,win32,x86C++打包成为dll首先创建一个win32的C++项目然后点击向导中的dll然后在这个文件中编写dll的函数......
  • ElasticSearch第1讲(4万字详解 Linux下安装、原生调用、API调用超全总结、Painless、IK
    ElasticSearch官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/current/getting-started.html非官方中文文档:https://learnku.com/docs/elasticsearch73/7.3极简概括:基于ApacheLucene构建开源的分布式搜索引擎。解决问题:MySQLlike中文全文搜索不走索引......
  • delphi调用Java类
    1、jdk的安装:https://www.cnblogs.com/ljk2008/p/18324820。2、jvm.dll:如果提示找不到JVM.dll需要在classpath、path中分别添加jvm.dll的路径。3、用到三方库:https://github.com/aleroot/DelphiJNI.git。4、JAVA类(CLASS、JAR)要放置在对应的文件夹内,如:packagecom.com1.com2;对......
  • 使用pybind11封装c++的dll,供python调用
    用pip安装好pybind11 文件清单,都写在一个目录里//文件名:add.cppextern"C"doubleadd(doublein1,doublein2){returnin1+in2;}//文件名:sub.cppextern"C"doublesub(doublein1,doublein2){returnin1-in2;}//文件名:mul.cppextern"......
  • 实现一个自己的OpenFeign 远程调用验证协议--Springboot 自定义拦截器验证请求合法性-
    Springboot如何实现一个自定义的拦截器处理系统发出的请求以及接收到的请求(实现一个用于feign远程调用验证的简单协议)文章目录Springboot如何实现一个自定义的拦截器处理系统发出的请求以及接收到的请求(实现一个用于feign远程调用验证的简单协议)**实现Feign拦截器的意......