首页 > 其他分享 >baichuan2-13b-chat加速

baichuan2-13b-chat加速

时间:2023-11-02 17:35:19浏览次数:39  
标签:13b github 模型 chat baichuan2 vllm 加速

当前加速框架层出不穷,到底哪个能一统天下未可知,那在当前阶段我们加速大模型该选取哪个框架呢。目前存在的大模型加速框架:VLLM,TGI,FasterTransformer,DeepSpeed-MII,FlexFlow Server,LMDeploy等等等等。但是这些框架大部分支持的模型都很少,或只支持英文模型,支持中文模型的更少,目前社区最活跃的就是伯克利大学出的这个VLLM框架了,目前github 9.1k星,但当前这个框架支持的模型有一部分https://github.com/vllm-project/vllm ,虽支持百川,但定睛一看支持baichuan不支持baichuan2,这两者有些差别,我仍然不死心,用它来加速baichuan2试试,加速是能加速,但完全不能与人交流。有人说它的惩罚计算方式与HF计算不一致导致模型加速前后输出不同,也有人说attention计算导致的,先说结果,结果就是真的不支持baichuan2-13b,说一下工作:
1、首先说明一点,用官方的api接口启动,然后openai_chatcompletion_client.py调用模型,输出总是不一致并且很离谱,所以能自己写就自己写吧;
2、尝试修改惩罚计算方式,看知乎上有人说:https://github.com/yanxiyue/vllm 修复了问题,不知道别的model是咋样,反正baichuan2仍然不行;
3、尝试增加baichuan2.py等一系列工作到VLLM库中,具体参考:https://github.com/vllm-project/vllm/pull/1022/files 现在发现这个同学的merge请求已经被拒绝了,总之不行;
4、我认真仔细看了一下代码中的惩罚计算,baichuan中有一个重复惩罚项,但vllm根本就没有给这个选择,然后看到有个大神加上去了:https://github.com/vllm-project/vllm/pull/1424 试过,还是不行
所以总之,不太支持baichuan2-13b,中文开源的大模型到底哪家强,谁能告诉我

标签:13b,github,模型,chat,baichuan2,vllm,加速
From: https://www.cnblogs.com/Leahy/p/17798098.html

相关文章

  • 文心一言 VS 讯飞星火 VS chatgpt (126)-- 算法导论11.1 1题
    一、用go语言,假设一动态集合S用一个长度为m的直接寻址表T来表示。请给出一个查找S中最大元素的过程。你所给的过程在最坏情况下的运行时间是多少?文心一言,代码正常运行:在这个问题中,我们需要实现一个查找动态集合S中最大元素的算法,该动态集合使用一个长度为m的直接寻址......
  • 使用 Sealos 将 ChatGLM3 接入 FastGPT,打造完全私有化 AI 客服
    FastGPT是一款专为客服问答场景而定制的开箱即用的AI知识库问答系统。该系统具备可视化工作流功能,允许用户灵活地设计复杂的问答流程,几乎能满足各种客服需求。在国内市场环境下,离线部署对于企业客户尤为重要。由于数据安全和隐私保护的考虑,企业通常不愿意将敏感数据上传到线上......
  • 开源项目一 ChatGPT UI
    ChatGPTUIChatGPTUI是一个开源项目,旨在为用户提供轻松、直观的方式与ChatGPT进行对话。我们相信,对话是连接人与人、人与技术的最强大方式,因此我们创建了这个前端UI工具,使ChatGPT的交互变得更加容易和有趣。项目地址https://gitee.com/supertinys_ryan/chatgpt-uiChatPDF与......
  • 利用 ChatGPT-Next 搭建本地的 ChatGPT
    默认ChatGPTNext不支持使用Azure服务,略微进行了修改。(1)修改了openai.ts(仅二处)(3)启动web后,设置接口地址(3)使用>yarndev启动服务为了以后每次使用方便,写一个简单的脚本。@echooffcd/dF:\workspace\ChatGPT-Next-Webyarndev......
  • 转:ChatGLM3-6B测评
    全新ChatGLM3-6B针对七项RAG能力的评测,谁最适合RAG?原创这个男人来自千祥土猛的员外2023-10-3017:32发表于浙江https://mp.weixin.qq.com/s/6fnZt2sBTakfXZMcS-scPA1.实体提取实体和关系提取当然也可以使用NER,但是有大模型,为什么不用呢,而且它后面还可以做格式,所以在RAG应......
  • CRMchat开源客服系统-界面版权去除与修改
    前端界面去除版权 修改界面进入template/admin目录安装依赖npminstall开发模式运行修改vue.config.js中的,此处反代线上网址```devServer:{proxy:'http://crmchat.v1kf.com'},```聊天页面版权template\admin\src\pages\kefu\externalConnection\pcCustomerServer.vu......
  • 文心一言 VS 讯飞星火 VS chatgpt (124)-- 算法导论10.5 5题
    五、用go语言,给定一个n结点的二叉树,写出一个O(n)时间的非递归过程,将该树每个结点的关键字输出。要求除该树本身的存储空间外只能使用固定量的额外存储空间,且在过程中不得修改该树,即使是暂时的修改也不允许。文心一言:您可以使用一个栈来存储节点,以便在遍历二叉树时进行回溯。由于您......
  • 文心一言 VS 讯飞星火 VS chatgpt (124)-- 算法导论10.5 5题
    五、用go语言,给定一个n结点的二叉树,写出一个O(n)时间的非递归过程,将该树每个结点的关键字输出。要求除该树本身的存储空间外只能使用固定量的额外存储空间,且在过程中不得修改该树,即使是暂时的修改也不允许。文心一言:您可以使用一个栈来存储节点,以便在遍历二叉树时进行回溯。由......
  • 文心一言 VS 讯飞星火 VS chatgpt (122)-- 算法导论10.4 3题
    三、用go语言,给定一个n结点的二叉树,写出一个O(n)时间的非递归过程,将该树每个结点的关键字输出。可以使用一个栈作为辅助数据结构。文心一言:以下是一个使用Go语言编写的函数,该函数使用一个栈作为辅助数据结构,以非递归方式遍历二叉树,输出每个结点的关键字。这个算法的时间复杂度为......
  • 运用chatGPT生成E-R图的prompt
     根据以上内容,让我们定义用例让我们为用例定义一个数据模型   更详细地描述数据模型或使用Markdown的表格格式这种模型可以根据具体的用例进行扩展和修改,以满足需求分析和设计过程中的实际需要。 为所有的数据模型定义关系,实体关系图输出为PlantUML 将带......