首页 > 其他分享 >如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上?

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上?

时间:2023-10-08 16:46:28浏览次数:42  
标签:服务 千问 部署 模型 AIGC Llama2 开源 应用 函数

作者:寒斜 阿里云智能技术专家 「本文是“在 Serverless 平台上构建 AIGC 应用”系列文章的第一篇文章。」

前言

随着 ChatGPT 以及 Stable Diffusion,Midjourney 这些新生代 AIGC 应用的兴起,围绕 AIGC 应用的相关开发变得越来越广泛,有呈井喷之势,从长远看这波应用的爆发不仅仅是停留在形式之上,更是在各个领域产生实际的生产力价值,比如办公领域有 copilot system 365,钉钉智能;代码编程领域有 github copilot,cursor ide; 文娱领域的妙鸭相机;可以肯定的是未来 AIGC 的应用数量会更多,类型也会更加丰富,企业的内部软件或者 SOP 都会尽可能的跟 AI 进行融合,这必然催生出海量的 AIGC 应用开发需求,这也代表着巨大的市场机会。

开发 AIGC 应用的挑战

AIGC 的应用前景如此诱人,可能决定企业未来的发展走向。然而对很多中小企业及开发者而言,上手进行 AIGC 应用的开发依然有着非常高昂的成本:

  • 基础模型服务的获取:chatgpt 提供了非常完善的 api 开发体系,然而并不开放给国内客户使用,开源的模型进行服务的部署非常困难
  • 高昂的费用, GPU 短缺导致 GPU 的费用急剧飙升,本地购买高规格显卡需要一次性花费不少的成本,并且并不能提供在线服务。
  • 端到端的对接:单纯模型服务的 api 无法变成直接的生产力,需要完成【企业数据&企业 SOP】-> LLM 服务 -> 各种端侧的完整链路

函数计算 AIGC 应用的解决方案

函数计算围绕创建和使用 AIGC,从基础设施到应用生态,开发端到使用端提供的完整的配套。

主要包含三个部分:

一、模型服务底座,函数计算可以部署来自魔搭,huggingface 等开元社区的 ai 模型,我们针对 LLM,Bert 等智能知识库/助手场景做了专门的定制,接入 OpenAI 兼容的 api 规范,提供一键部署的模版和可视化的 web 访问界面,帮助开发者或者企业快速上手 llama2,chatglm2,通义千问等模型的部署。

二、业务连接层,串联业务需求以及的模型服务,安全服务,数据库服务等基础资源,这部分有在 AIGC 应用部分有很多相同的逻辑,比如账号体系,数据集管理,提示词模版,工具管理,模型服务管理等,从各业务侧视角看,不一样的部分只是 提示词,知识库以及工具集,底层的模型服务,安全服务,数据库服务则是共享的,这层可以简化业务里面构建不同智能场景的流程,快速,低成本的可以构建不同业务的 AIGC 应用。

三、客户端侧,客户端是 AI 应用的使用部分,也是最接近业务的部分,这部分更多的考虑是如何将 AI 服务融入已有的使用端,比如钉钉,企业微信等办公 IM 系统,以及 web 浏览器插件等,通过函数计算+eventbridge 可以快速帮助 ai 服务接入到这些客户端。

本篇教程先来分享一下第一个部分,如何通过函数计算快速部署 AIGC 相关模型服务包括 LLM 模型和 Embedding(Bert) 模型。

LLM 模型及 Embedding 服务部署教程

前期准备

使用该项目,您需要有开通以下服务:

服务 备注
函数计算 FC 对 AIGC 进行 CPU/GPU 推理计算:https://free.aliyun.com/?pipCode=fc
文件存储 NAS 存储大语言模型以及 Embedding 服务所需要的模型,新用户请先领取免费试用资源包:https://free.aliyun.com/?product=9657388&crowd=personal

应用介绍

应用详情

使用阿里云函数计算部署开源大模型应用,提供兼容 openai 规范的接口和 ChatGPT-Next-Web 客户端。

ChatGPT-Next-Web:

https://github.com/Yidadaa/ChatGPT-Next-Web

操作文档

llm 应用模版

登录到阿里云函数计算控制台->应用->创建应用-> 人工智能选择 AI 大语言模型 API 服务应用模板点击"立即创建"。

应用模版设置

设置好知道点击"创建并部署默认环境"。

等待部署

该过程您会自动完成。

服务访问

服务部署成功之后会返回两个链接。

  1. llm-server 为大语言模型的 api 服务界面,基于 swagger。

  1. llm-client 则是访问客户端,访问客户端需要您输入前面填写的客户端私有密码,填写好之后就可以测试使用了。

embedding 模版

登录到阿里云函数计算控制台->应用->创建应用-> 人工智能选择 “开源 Bert 模型服务” 应用模板点击"立即创建"。

应用模版设置

选择好地域创建即可。

等待部署

该过程您会自动完成。

服务访问

测试 embedding 接口。

总结

部署好 LLM 服务意味着您已经开启了 AIGC 应用的开发旅程,接下来我会继续跟大家分享更多关于 AIGC 相关的内容,包括如何构建知识库问答应用,如何调用工具完善大语言模型的能力,如何接入自己的 IM 系统和构建 web 的集成插件。


宇宙漫游,阿里云 x 森马 AIGC T 恤设计大赛

一、【森马X阿里云 AIGC T 恤设计大赛】

程序员 AIGC 自己的 T 恤,赢 Airpods,图案定制 T 恤!

通过函数计算 FC 快捷部署 Stable Diffusion:内置模型库+常用插件+ControlNet,支持 SDXL1.0。

立即参加:https://developer.aliyun.com/adc/series/activity/aigc_design

可赢取 Airpods 三代,作品定制联名体恤,森马行李箱等周边!

二、参加话题活动

一起讨论 AIGC 的未来发展趋势,用户可从任意角度交流分享,可以赢得护眼台灯、数据线、静音净化器奖品!

话题:《相比优秀的服装设计师,AIGC 可以如何突破设计灵感的界限?是纯粹的机械语言还是一点点的灵光乍现?》https://developer.aliyun.com/ask/548537?spm=a2c6h.13148508.setting.14.4a894f0esFcznR

标签:服务,千问,部署,模型,AIGC,Llama2,开源,应用,函数
From: https://www.cnblogs.com/alisystemsoftware/p/17749549.html

相关文章

  • 实验3:OpenFlow协议分析实践 实验4:开源控制器实践——OpenDaylight
    实验3:OpenFlow协议分析实践一、实验目的能够运用wireshark对OpenFlow协议数据交互过程进行抓包;能够借助包解析工具,分析与解释OpenFlow协议的数据包交互过程与机制。二、实验环境Ubuntu21.10三、实验内容搭建拓扑,完成相关IP配置,并连接OpenDaylight控制器,实现主机......
  • 开源即时通讯IM框架 MobileIMSDK v6.4 发布
    一、更新内容简介本次更新为次要版本更新,进行了若干优化(更新历史详见:码云ReleaseNotes、GithubReleaseNotes)。MobileIMSDK可能是市面上唯一同时支持 UDP+TCP+WebSocket 三种协议的同类开源IM框架。二、MobileIMSDK简介MobileIMSDK 是一套专为移动端开发的原创IM通信......
  • 常见的开源软件许可证(License)
    常见的开源软件许可证(License)软件许可证(softwarelicense)是一种格式合同,由软件作者与用户签订,用以规定和限制软件用户使用软件或其源代码的权利,以及作者应尽的义务License受到《合同法》的保护开源的定义开放源代码促进会(OpenSourceInitiative-OSI),提出开源需要满足......
  • 【python自动化】七月PytestAutoApi开源框架学习笔记(二)
    执行流程注:请先阅读作者的README.md文档https://gitee.com/yu_xiao_qi/pytest-auto-api2/blob/master/README.md本节内容目录如下:文章目录执行流程目录结构参数配置入口文件-run.pypytest.initest_case初始化数据缓存解析yaml测试数据测试用例执行conftest.py用例demo分析加载yaml......
  • 开源数据库Mysql_DBA运维实战 (DDL语句)
    DDLDDL语句数据库定义语言:数据库、表、视图、索引、存储过程.例如:CREATE DROPALTERDDL库定义库{CREAATEDATABASE  ___数据库名___ ;                数据库名要求{                                        a.......
  • stepci 开源api 自动测试框架
    stepci是基于nodejs开发的,开源api自动测试框架包含的特性语言无关 可以基于yaml,json,js定义支持多种框架 rest,graphl,grpc,trpc,soap自托管 可以集成到ci/cd中,同时可以自己部署与行可集成 可以很好的与其他工具集成说明stepci目前也支持负载测试(预览状态),同时还支持f......
  • 推荐一款好用的开源视频播放器(免费无广告)
    mpv是一个自由开源的媒体播放器,它支持多种音频和视频格式,并且具有高度可定制性。mpv的设计理念是简洁、高效和功能强大。软件特点:1.开源、跨平台。可以在Windows\Linux\MacOS\BSD等系统上使用,完全免费无广告。Windows版解压即用,绿色便携。2.兼容性好。支持绝大多数视频、音频、......
  • 火山引擎 ByteHouse 与白鲸开源完成兼容性认证,加速数据价值释放
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群数据作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和治理方式。越来越多企业也在尝试充分利用数据要素,开辟全新发展路径,进一步实现业务......
  • 轻量级开源在线任务管理工具-DooTask
    项目简介DooTask是一款开源在线项目任务管理工具提供各类文档协作工具、项目提供在线思维导图、在线流程图、项目管理、任务分发、即时IM,文件管理等工具。官网:DooTask源码地址GithubGitee功能特色高效便捷的团队沟通工具针对项目和任务建立群组,工作问题可及时沟通,促进团队快速协作......
  • Llama2-Chinese项目:3.2-LoRA微调和模型量化
      提供LoRA微调和全量参数微调代码,训练数据为data/train_sft.csv,验证数据为data/dev_sft.csv,数据格式为"<s>Human:"+问题+"\n</s><s>Assistant:"+答案。本文主要介绍Llama-2-7b模型LoRA微调以及4bit量化的实践过程。1.LoRA微调脚本  LoRA微调脚本train/sft/finetune_lora......