首页 > 其他分享 >千问72-chat私有化部署

千问72-chat私有化部署

时间:2024-03-07 22:01:15浏览次数:29  
标签:Chat 72B 千问 Qwen openai 72 chat response

  千问开源的版本挺多,版本有1和1.5,参数有1.8~72B,模态有语言、语音、视觉。72B就有Qwen-72b-chat(聊天)和Qwen-72b(基础/预训练)两个版本,以下为简单的Qwen-72b-chat的坑:

1、下载模型(魔塔社区),权重文件140+G

2、新建虚拟环境,基础要求:python>3.8、pytorch>1.12、cuda>11.4;依赖:"transformers>=4.32.0" accelerate tiktoken einops scipy transformers_stream_generator==0.0.4 peft deepspeed。缺少一些操作系统级的组件会导致后面各种错误:glibc-devel、gcc、gcc-c++。还要注意的就是PATH环境,没有/usr/sbin/ldconfig就会有问题。

3、作为服务器运行:

  • 下载框架:https://github.com/QwenLM/Qwen#vllm
  • 使用openai模式提供服务(假定模型保存在/app/model/Qwen-72B-Chat):python3 openai_api.py -c /app/model/Qwen-72B-Chat --server-name 0.0.0.0

4、远程调用:

  • http方式:
    import requests
    import json
    
    # 你的OpenAI API密钥
    OPEN_AI_API_KEY = 'none'
    
    # 示例:调用Chat Completion API
    endpoint_url = "http://192.168.1.2:8000/v1/chat/completions"
    
    # 请求体参数
    request_body = {
        "model": "Qwen-72b-Chat",
        "messages": [
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "你好"}
        ]
    }
    
    # 添加请求头
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {OPEN_AI_API_KEY}"
    }
    
    # 发送POST请求
    response = requests.post(endpoint_url, headers=headers, json=request_body)
    
    # 检查请求是否成功
    if response.status_code == 200:
        # 解析返回的JSON数据
        result = response.json()
        print(result)
    else:
        print(f"请求失败,状态码:{response.status_code}")
        print(f"错误详情:{response.text}")
  • openai方式(openai 0.28.1版本),必须低于1.0。暂未搞定流式
    import openai
    openai.api_base = "http://192.168.1.2:8000/v1"
    openai.api_key = "none"
    
    response = openai.ChatCompletion.create(
        model="Qwen-72B-Chat",
        messages=[
            {"role": "user", "content": "你好"}
        ],
        stream=False,
        stop=[] # You can add custom stop words here, e.g., stop=["Observation:"] for ReAct prompting.
    )
    print(response.choices[0].message.content)

     

标签:Chat,72B,千问,Qwen,openai,72,chat,response
From: https://www.cnblogs.com/badwood316/p/18059874

相关文章

  • ChatGLM3 源码解析(三)
    RotaryEmbedding#旋转位置嵌入,应用于每一层Q和KclassRotaryEmbedding(nn.Module):def__init__(self,dim,rope_ratio=1,original_impl=False,device=None,dtype=None):super().__init__()#除法项定义inv_freq=1.0/(10000**(to......
  • 文心一言 VS 讯飞星火 VS chatgpt (209)-- 算法导论15.4 6题
    六、设计一个O(nlgn)时间的算法,求一个n个数的序列的最长单调递增子序列。(提示:注意到,一个长度为i的候选子序列的尾元素至少不比一个长度为i-1候选子序列的尾元素小。因此,可以在输入序列中将候选子序列链接起来。)要写代码的时候,请用go语言。文心一言,代码正常运行:要设计一......
  • 【已解决】[图文步骤] message from server: “Host ‘172.17.0.1‘ is not allowed t
    写于2024.03.07北京.朝阳@目录报错信息环境现场解决方案步骤:成功最后报错信息先看看和你的报错一样不一样null,messagefromserver:"Host'172.17.0.1'isnotallowedtoconnecttothisMySQLserver"环境现场mac电脑使用docker部署了一个mysql。docker......
  • ChatGPT 新增朗读功能;微软 Win11 鼠标悬停自动打开 Copilot 丨 RTE 开发者日报 Vol.15
      开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点......
  • 感谢ChatGPT,救了我狗的命!
    部门缺人,前端后端测试岗,base深圳/西安/北京:jinshuju.net/f/o38ijj前一段时间,国外一位小哥哥在推特上发布了一条消息,声称GPT-4拯救了自家狗狗的性命。这是怎么一回事呢?这个小哥哥养了一只两岁的边境牧羊犬,这只牧羊犬被诊断出患有蜱传疾病,这属于一种细菌性传染病。虽然小哥哥一......
  • C#通义千问apl
    1.在阿里申请和开通模型服务灵积:链接地址2.在gitee下载代码:Gitee链接3.在代码中更换你的API-KEY4.注意要开通:通义千问/qwen-turbo模型5.如图所示......
  • 基于SWIFT和Qwen1.5-14B-Chat进行大模型全参微调测试
    基于SWIFT和Qwen1.5-14B-Chat进行大模型全参微调测试环境准备基础环境操作系统:Ubuntu18.04.5LTS(GNU/Linux3.10.0-1127.el7.x86_64x86_64)Anaconda3:Anaconda3-2023.03-1-Linux-x86_64根据服务器网络情况配置好conda源和pip源,此处使用的是超算山河源服务器硬件配置:CPU......
  • 572. 另一棵树的子树c
    /***Definitionforabinarytreenode.*structTreeNode{*intval;*structTreeNode*left;*structTreeNode*right;*};*/boolissameroot(structTreeNode*p,structTreeNode*q){if(!p&&!q)returntrue;if(!q&......
  • 文心一言 VS 讯飞星火 VS chatgpt (208)-- 算法导论15.4 5题
    五、设计一个O($n^2$)时间的算法,求一个n个数的序列的最长单调递增子序列。要写代码的时候,请用go语言。文心一言,抛panic:在Go语言中设计一个O(n^2)时间复杂度的算法来求一个n个数的序列的最长单调递增子序列(LongestIncreasingSubsequence,LIS)可以使用动态规划的方法......
  • ChatGPT用10秒画完一张UML流程图,而我用了。。。
    不用AI的程序员,失业潮真的快来临了。一张订单履约的流程图,我花了10分钟才完成,而ChatGPT绘图过程只用了10秒钟,基本可以达到同样的水平,通过ChatGPT可以显著提高画流程图的效率。订单履约流程是一系列精细协作的流程,从客户在销售平台下单开始,至商品交付用户手中结束。此过程跨越多......