千问72-chat私有化部署

时间：2024-03-07 22:01:15浏览次数：29

标签：Chat 72B 千问 Qwen openai 72 chat response

　　千问开源的版本挺多，版本有1和1.5，参数有1.8～72B，模态有语言、语音、视觉。72B就有Qwen-72b-chat（聊天）和Qwen-72b（基础/预训练）两个版本，以下为简单的Qwen-72b-chat的坑：

1、下载模型（魔塔社区），权重文件140+G

2、新建虚拟环境，基础要求：python>3.8、pytorch>1.12、cuda>11.4；依赖："transformers>=4.32.0" accelerate tiktoken einops scipy transformers_stream_generator==0.0.4 peft deepspeed。缺少一些操作系统级的组件会导致后面各种错误：glibc-devel、gcc、gcc-c++。还要注意的就是PATH环境，没有/usr/sbin/ldconfig就会有问题。

3、作为服务器运行：

下载框架：https://github.com/QwenLM/Qwen#vllm
使用openai模式提供服务（假定模型保存在/app/model/Qwen-72B-Chat）：python3 openai_api.py -c /app/model/Qwen-72B-Chat --server-name 0.0.0.0

4、远程调用：

http方式：

import requests
import json

# 你的OpenAI API密钥
OPEN_AI_API_KEY = 'none'

# 示例：调用Chat Completion API
endpoint_url = "http://192.168.1.2:8000/v1/chat/completions"

# 请求体参数
request_body = {
    "model": "Qwen-72b-Chat",
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "你好"}
    ]
}

# 添加请求头
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {OPEN_AI_API_KEY}"
}

# 发送POST请求
response = requests.post(endpoint_url, headers=headers, json=request_body)

# 检查请求是否成功
if response.status_code == 200:
    # 解析返回的JSON数据
    result = response.json()
    print(result)
else:
    print(f"请求失败，状态码：{response.status_code}")
    print(f"错误详情：{response.text}")

openai方式（openai 0.28.1版本），必须低于1.0。暂未搞定流式

import openai
openai.api_base = "http://192.168.1.2:8000/v1"
openai.api_key = "none"

response = openai.ChatCompletion.create(
    model="Qwen-72B-Chat",
    messages=[
        {"role": "user", "content": "你好"}
    ],
    stream=False,
    stop=[] # You can add custom stop words here, e.g., stop=["Observation:"] for ReAct prompting.
)
print(response.choices[0].message.content)

标签：Chat,72B,千问,Qwen,openai,72,chat,response
From： https://www.cnblogs.com/badwood316/p/18059874

ChatGLM3 源码解析（三）
RotaryEmbedding#旋转位置嵌入，应用于每一层Q和KclassRotaryEmbedding(nn.Module):def__init__(self,dim,rope_ratio=1,original_impl=False,device=None,dtype=None):super().__init__()#除法项定义inv_freq=1.0/(10000**(to......
文心一言 VS 讯飞星火 VS chatgpt （209）-- 算法导论15.4 6题
六、设计一个O(nlgn)时间的算法，求一个n个数的序列的最长单调递增子序列。（提示：注意到，一个长度为i的候选子序列的尾元素至少不比一个长度为i-1候选子序列的尾元素小。因此，可以在输入序列中将候选子序列链接起来。）要写代码的时候，请用go语言。文心一言，代码正常运行：要设计一......
【已解决】[图文步骤] message from server: “Host ‘172.17.0.1‘ is not allowed t
写于2024.03.07北京.朝阳@目录报错信息环境现场解决方案步骤：成功最后报错信息先看看和你的报错一样不一样null,messagefromserver:"Host'172.17.0.1'isnotallowedtoconnecttothisMySQLserver"环境现场mac电脑使用docker部署了一个mysql。docker......
ChatGPT 新增朗读功能；微软 Win11 鼠标悬停自动打开 Copilot 丨 RTE 开发者日报 Vol.15
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（RealTimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点......
感谢ChatGPT，救了我狗的命！
部门缺人，前端后端测试岗，base深圳/西安/北京：jinshuju.net/f/o38ijj前一段时间，国外一位小哥哥在推特上发布了一条消息，声称GPT-4拯救了自家狗狗的性命。这是怎么一回事呢？这个小哥哥养了一只两岁的边境牧羊犬，这只牧羊犬被诊断出患有蜱传疾病，这属于一种细菌性传染病。虽然小哥哥一......
C#通义千问apl
1.在阿里申请和开通模型服务灵积：链接地址2.在gitee下载代码：Gitee链接3.在代码中更换你的API-KEY4.注意要开通：通义千问/qwen-turbo模型5.如图所示......
基于SWIFT和Qwen1.5-14B-Chat进行大模型全参微调测试
基于SWIFT和Qwen1.5-14B-Chat进行大模型全参微调测试环境准备基础环境操作系统：Ubuntu18.04.5LTS(GNU/Linux3.10.0-1127.el7.x86_64x86_64)Anaconda3：Anaconda3-2023.03-1-Linux-x86_64根据服务器网络情况配置好conda源和pip源，此处使用的是超算山河源服务器硬件配置：CPU......
572. 另一棵树的子树c
/***Definitionforabinarytreenode.*structTreeNode{*intval;*structTreeNode*left;*structTreeNode*right;*};*/boolissameroot(structTreeNode*p,structTreeNode*q){if(!p&&!q)returntrue;if(!q&......
文心一言 VS 讯飞星火 VS chatgpt （208）-- 算法导论15.4 5题
五、设计一个O($n^2$)时间的算法，求一个n个数的序列的最长单调递增子序列。要写代码的时候，请用go语言。文心一言，抛panic：在Go语言中设计一个O(n^2)时间复杂度的算法来求一个n个数的序列的最长单调递增子序列（LongestIncreasingSubsequence,LIS）可以使用动态规划的方法......
ChatGPT用10秒画完一张UML流程图，而我用了。。。
不用AI的程序员，失业潮真的快来临了。一张订单履约的流程图，我花了10分钟才完成，而ChatGPT绘图过程只用了10秒钟，基本可以达到同样的水平，通过ChatGPT可以显著提高画流程图的效率。订单履约流程是一系列精细协作的流程，从客户在销售平台下单开始，至商品交付用户手中结束。此过程跨越多......

千问72-chat私有化部署

相关文章

赞助商

阅读排行