首页 > 其他分享 >D1-书生·浦语大模型全链路开源体系

D1-书生·浦语大模型全链路开源体系

时间:2024-01-04 17:33:16浏览次数:30  
标签:评测 项目 推理 模型 开源 链路 数据 浦语 D1

大模型成为发展通用人工智能的重要途径。“书生·浦语”是商汤科技、上海AI实验室联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型。

D1-书生·浦语大模型全链路开源体系_大模型

D1-书生·浦语大模型全链路开源体系_人工智能_02

业务场景简单,如通用对话,直接将模型拿过来,运用prompt engineering接入业务场景;部分微调,如LoRA;调用外部API,或与数据库交互 → 需要智能体;模型评测通过则上线,评测不通过需要在之前的微调中做迭代;模型部署问题:最少的资源来增加吞吐量。

D1-书生·浦语大模型全链路开源体系_大模型_03

书生·浦语大模型全链路开源体系,包含数据、预训练、微调、部署、评测、应用端到端全流程体系。

D1-书生·浦语大模型全链路开源体系_开源_04

数据

书生·万卷 1.0 - 多模态语言库,含有2TB数据,涵盖多种模态与任务

  • 数据类型:文本数据(>1TB),图像-文本数据集(>140GB),视频数据(>900GB)
  • 特点:多模态融合且多领域,精细化处理(数据预处理技术),价值观对齐(合法合规)
  • 开放的数据平台:OpenDatalab - 5400多个数据集,还有智能标注工具

在OpenDataLab开源数据管理平台上,有许多的数据,大家都可以共享自己高质量的数据。

      OpenDataLab开源数据集

其中,InternLM大模型预训练数据:

                                         书生·万卷1.0数据集

以书生·万卷1.0为例,数据包含文本数据集、图文数据集、视频数据集三部分,数据总量超过2TB。基于大模型数据联盟构建的语料库,上海人工智能实验室对其中部分数据进行细粒度清洗、去重以及价值对齐,形成了书生·万卷1.0,具备多元融合、精细处理、价值对齐、易用高效等四大特征。

而其中的文本数据集部分,由来自网页、百科、书籍、专利、教材、考题等不同来源的清洗后预训练语料组成,数据总量超过5亿个文档,数据大小超过1TB。该语料将html、text、pdf、epub等多种格式的数据统一处理为字段统一的jsonl格式,并经过细粒度的清洗、去重、价值对齐,形成了一份安全可信、高质量的预训练语料。

D1-书生·浦语大模型全链路开源体系_人工智能_05

D1-书生·浦语大模型全链路开源体系_开源_06

预训练

InternLM(github搜索关键字)为上海人工智能实验室发布的大模型,具体模型下载、使用、训练过程可以参考开源项目链接:InternLM大模型

项目支持从8卡到千卡训练,千卡加速效率达92%。支持Hybrid Zero独特技术+极致优化,加速50%。支持无缝接入HuggingFace等技术生态,支持各类轻量化技术。

D1-书生·浦语大模型全链路开源体系_大模型_07

微调

微调包括增量续训和有监督微调。增量续训主要用于让基座模型学习到一些新知识,如某个垂类领域知识文章、书籍、代码等;有监督微调主要用于让模型学会理解和遵循各种指令,或者注入少量领域知识,如高质量对话、问答数据。

上海人工智能实验室为支持各类主流模型微调,开源了xtuner项目,具体微调过程,可参考链接:

                                    xtuner大模型微调

xtuner项目支持各类微调数据集和主流的大模型,并且支持能力也在持续升级中,如强化学习对齐人类偏好。

D1-书生·浦语大模型全链路开源体系_大模型_08

D1-书生·浦语大模型全链路开源体系_大模型_09

评测

斯坦福HELM评测项目链接(包括对应论文):HELM评测项目

FlagEval评测项目链接:FlagEval评测项目

MMLU评测官网:MMLU评测

Alpaca Eval评测项目链接:Alpaca Eval评测项目

SuperCLUE评测项目链接:SuperCLUE评测项目

OpenLLM LeaderBoard:OpenLLM评测榜单

上海人工智能实验室在这些基础上,发布了更加全面的OpenCompass评测体系

                            OpenCompass项目链接

包含6大维度,80+评测集,40万+评测题目,如下:

D1-书生·浦语大模型全链路开源体系_开源_10

D1-书生·浦语大模型全链路开源体系_开源_11

部署

针对大语言模型内存开销巨大、庞大的参数量、采用自回归生成token、需要缓存k/v、动态Shaps、请求数不固定、逐个生成数量不定token、transformer结构特点。如何加速token的生成速度?如何解决动态shape,让推理可以不间断?如何有效管理和利用内存服务?如何提升系统整体吞吐量?如何降低请求的平均响应时间?

上海人工智能实验室结合模型并行技术、低比特量化技术、Atterntion优化技术、计算和访存优化技术、Continuous Batching技术,有效解决上述问题,推出高效推理引擎LMDeploy开源项目。具体的,大模型项目如何高效推理部署,可参考开源项目:

                        LMDeploy大模型高效推理部署

LMDeploy开发了两个推理引擎——Pytorch和TurboMind,它们各自侧重于不同的方面,前者致力于推理性能的最终优化,而后者则纯粹在Python中开发,旨在降低开发人员的门槛。

在各种规模的模型中,TurboMind引擎的请求吞吐量比vLLM高1.36 ~ 1.85倍。 在静态推理能力方面,TurboMind的4bit模型推理的token吞吐量(输出token/s)显著优于FP16/BF16推理,最高提高了2.4倍。

D1-书生·浦语大模型全链路开源体系_大模型_12

为了解决部署中的问题,提出了LMDeploy - 大模型在GPU上部署的解决方案,还有轻量化、推理和服务

  • 接口:Python, gRPC, RESTful
  • 轻量化:4bit权重, 8bit k/v
  • 推理引擎:turbomind, pytorch
  • 服务:openai-server, gradio, triton inference server

推理性能

  • 静态:固定batch,输入/输出token数量,评测整体吞吐量
  • 动态:真实对话,不定长的输入/输出,评测请求的吞吐量

D1-书生·浦语大模型全链路开源体系_人工智能_13

大模型应用方面,上海人工智能实验室推出两个开源项目:轻量级智能体Lagent,多模态智能体工具箱AgentLego。

Lagent是一个轻量级的开源框架,允许用户高效地构建基于大型语言模型(LLM)的代理。项目链接:Lagent智能体开源项目

D1-书生·浦语大模型全链路开源体系_大模型_14

D1-书生·浦语大模型全链路开源体系_大模型_15

关于智能体一个典型的应用场景是,大模型不擅长数学计算,智能体会将PythonInterpreter作用工具使用,从而增强模型输出的正确性。关于智能体PythonInterpreter使用demo,可参考如下链接第3部分(Lagent 智能体工具调用 Demo)学习:

                         Lagent 智能体工具调用 Demo

为了进一步扩展智能体的工具集,AgentLego项目应运而生,是一个通用工具api的开源库,用于扩展和增强基于大型语言模型(LLM)的智能体能力。AgentLego项目链接:

                                Agentlego开源项目

能力图如下:

D1-书生·浦语大模型全链路开源体系_开源_16

下面再回顾一下书生·浦语大模型全链路开源体系:

D1-书生·浦语大模型全链路开源体系_开源_17


标签:评测,项目,推理,模型,开源,链路,数据,浦语,D1
From: https://blog.51cto.com/morcake/9102897

相关文章

  • [EFI]华为 Matebook D14 2020 电脑 Hackintosh 黑苹果efi引导文件
    硬件型号驱动情况主板MatebookD142020处理器 i7-10510U已驱动内存16GBLPDDR32133MHZ已驱动硬盘WDCPCSN73(不支持三星pm981/a)已驱动显卡NVIDIAGeForceMX250/Intel(R)UHD显卡620已驱动声卡瑞昱RealtekALC256@英特尔HighDefinitionAudio控制器已驱动网卡无线......
  • 【中小型企业网络实战案例 六】配置链路聚合
      原创:厦门微思网络  【微思2002年成立,专业IT认证培训21年!】相关文章【中小型企业网络实战案例五】配置可靠性和负载分担当CORE1或者CORE2的上行发生故障时,流量经过CORE1和CORE2互联的链路,但是单条链路有可能带宽不够,因而造成数据丢失。为了增加带宽,把多条物理链路捆绑为......
  • 【积微成著】性能测试调优实战与探索(存储模型优化+调用链路分析)| 京东物流技术团队
    一、前言性能测试之于软件系统,是保障其业务承载能力及稳定性的关键措施。以软件系统的能力建设为主线,系统能力设计工作与性能测试工作,既有先后之顺序,亦有相互之影响。以上,在性能测试的场景决策,架构分析、流量分析、压测实施和剖解调优等主要环节中,引发对于系统能力底盘夯实和测试策......
  • IP模块组装网络包及转发网络包链路
    引言之前协议栈系列的文章讲解了连接,收发网络包,断开连接这些操作协议栈模块的处理,但是协议栈是上层接下来会委托ip模块进行真正的处理。网络包网络包的组成网络包由头部的控制信息和头部后面的传输数据组成。控制信息代表了包要发往的目的地,传输数据就是要发送的数据网......
  • 数据链路层技术及应用
    数据链路层技术及应用1、移动承载网络中的数据链路层技术虚拟局域网(VirtualLocalAreaNetwork,VLAN)用于基站之间或者专线用户之间的数据隔离,每个基站或者每个业务属于一个独立的局域网。链路聚合(LinkAggregation,LAG)可以将多条链路进行捆绑,当一条链路出现问题时,其余链路能......
  • ACL&SCO链路介绍
    1、蓝牙协议栈体系结构按照各层协议在整个蓝牙协议体系中所处的位置,蓝牙协议可分为三大类:1,底层协议:射频RF,基带协议和链路管理协议。2,中间层协议:逻辑链路管理和适配协议,服务发现协议,串口仿真协议,以及电话通信协议等3,应用层协议:对应各种应用的profiles2,链路管理协议:链路管理协......
  • 物理层和数据链路层
    以太网第一层(物理层):线缆、速率和双工RJ-45针脚及5类线缆T568A:白绿、绿;白橙、蓝;白蓝、橙;白棕、棕T568B(最常用):白橙、橙;白绿、蓝;白蓝、绿;白棕、棕​ 交换机能检测线缆的使用是否正确,比如Cisco的Auto-MDIX(与介质相关的自动接口交叉器)能检测错误的线缆并使交换机交换其......
  • window下使用pybind11
    首先下载python,并且将python配置到环境变量中,如果使用window的安装程序,可以勾选自动添加到环境变量。下载pybind11源码,https://github.com/pybind/pybind11使用cmake-gui工具配置vs工程,并生成include头文件目录和cmake目录。(1)在pybind11源码目录中创建build目录和ins......
  • 优维产品最佳实践第20期:控制台全链路监控
    之前我们会觉得cmdb自动发现没有上报很难排查,弄不清楚数据的上报链路;监控指标的数据断点很难定位,flink对现场来说是一个黑盒子;apm数据更新不及时到底是上报异常还是入库失败呢?现在控制台集成了对数据链路的监控,数据上报链路全透明,问题节点一目了然,极大的减少问题定位的难度。「全......
  • H3CNA-RS+——交换机端口安全技术和链路聚合
    交换机端口安全技术和链路聚合802.1X技术简介定义:起源于Wlan的802.11,解决局域网终端的接入认证问题802.1X的体系结构认证方式:本地认证、远程集中认证端口接入控制方式:基于端口认证、基于mac地址认证802.1X基本配置示例端口隔离技术:用于在vlan内部隔离用户同一隔离组端口不能通讯,不......