首页 > 其他分享 >书生大模型实训营第4期基础岛第一关:书生大模型全链路开源体系介绍

书生大模型实训营第4期基础岛第一关:书生大模型全链路开源体系介绍

时间:2024-11-10 23:45:18浏览次数:3  
标签:实训营 评测 模型 书生 开源 数据 浦语

书生大模型实训营第4期基础岛第一关:书生大模型全链路开源体系介绍

1. 书生·浦语的开源之路

1.1 模型发展历程

在这里插入图片描述
在这里插入图片描述
过去的一年里,书生大模型不仅开源并升级了其全链条工具体系,模型性能也取得了显著提升,从23年7月初开源的 InternLM2.0 到今年7月的 InternLM2.5,模型主要有以下三方面的改进:

  1. 综合推理能力(模型的原生推理性能)相比 InterLM2.0 提升20%,性能处于开源模型前列。
  2. 支持百万字长文(GPT-4o的十倍)的理解和精确处理,“大海捞针”实验表现优异。
  3. 通过信息搜索和整合,针对复杂问题的回答效率提升60倍。

目前 InternLM2.5-20B-Chat 模型的性能已经达到 GPT-4(20240409) 的水平。

1.2 核心技术思路

1.2.1 模型训练迭代技术

在这里插入图片描述
目前书生系列模型的迭代还是基于数据驱动的策略,通过给模型投喂大量的高质量数据来提升模型能力。而除了真实数据外模型训练过程中还使用了一系列的合成数据,合成数据的构造主要使用了以下三种方法,通过融合多种数据合成方案,提升合成数据的质量:

  1. 基于规则的数据构造
  2. 基于模型的数据扩充
  3. 基于反馈的数据生成
1.2.2 基于规划和搜索解决复杂问题

在这里插入图片描述
不同于2.0版本,InternLM2.5 会模仿人的思维来对复杂问题进行求解,通过 问题分析→思维路径拆解→子问题求解→内容整合 这一流程,模型可以更加准确地理解问题的真实含义并给出更加可靠的回答。MindSearch 项目就是该流程的一个很好的示例,大家如果想简单了解 MindSearch 是什么以及怎么用的话可以看看我的这篇博文

1.3 书生·浦语开源模型谱系

在这里插入图片描述
目前书生模型家族有四个量级版本,分别是1.8B、7B、20B、102B大小的模型。其中1.8B的模型主要用于边缘设备的端侧应用以及研究者的本地学习等;7B的模型则已经具备了一定的能力,模型轻便但性能不俗,适用于一些轻量级的研究和应用;20B的模型性能更加强劲,已经可以满足一些中小企业的需求,并且不同于7B,20B的模型开始出现 “涌现” 现象——模型不再只是对见过的数据进行检索总结,对于没见过的东西,模型也可以做出有效回应;102B的模型的性能进一步提升,在典型场景下表现已经接近 GPT-4,不过目前暂未开源。

另外如果从模态上来分,书生模型还开源了下面一些项目,大家有兴趣的话可以去体验一下~:
(1)InternLM-XComposer(灵笔):图像—文本多模态模型
(2)InternLM-Math:针对数学场景的模型
(3)InternLM-WQX(文曲星):用于解答高考题目的模型

2. 书生·浦语全链路开源体系结构

在这里插入图片描述
书生·浦语的全链路开源包含了从 数据→预训练→微调→部署→测评→应用 的一条龙服务。

2.1 数据开源:书生·万卷

在这里插入图片描述
在这里插入图片描述
InternLM 的数据开源不仅开源了丰富多样的高质量训练数据,还开源了多款数据提取和标注工具,为模型的训练和微调提供了极大的数据支持和便利。

2.2 预训练框架开源:InternEvo

在这里插入图片描述
InternEvo 主要进行了一些显存优化以及通信优化,可以降低模型预训练的硬件要求。

2.3 微调工具开源:XTuner

在这里插入图片描述
XTuner 微调框架支持多种微调算法(如指令微调、多模态微调以及对齐等)、兼容多种数据集格式,并且 XTuner 内置多种优化加速方法,让开发者可以无需关注复杂的显存优化与加速计算细节,专注于问题本身。目前 XTuner 支持 NVIDIA 20系以上的所有显卡,最低只需要8G显存即可微调7B模型。

在这里插入图片描述
从上面这张图可以看出,XTuner 相比于 LLaMA Factory 等微调框架,在显存优化方面做的更好,这得益于 XTuner 零显存对齐的偏好训练方案

2.4 模型部署工具开源:LMDeploy

在这里插入图片描述
相比于 VLLM 框架,书生开源的 LMDeploy 支持更多的国产大模型部署,并且提供多种推理接口和服务,具有卓越的兼容性和高效的推理性能。

2.5 评测体系开源:OpenCompass

在这里插入图片描述
在这里插入图片描述

OpenCompass 是集 “工具—基准—榜单" 三位一体的国产大模型评测体系,它能为我们提供大模型全栈评测工具,支持高效评测和能力分析;它还能为我们提供高时效性、高质量的评测集,让大模型的评测更加客观真实;最后它还会发布权威性榜单,帮助开发者和研究人员洞悉行业趋势。

OpenCompass 评测体系目前已经广泛应用于大模型头部企业和科研机构,是唯一一个获得 Meta 官方推荐的国产大模型评测体系,同时也是开源社区最完善的评测体系之一,拥有超过100+评测集和50万+的题目。

2.6 基于大模型的开源应用

左:书生·浦语 | 右:书生·万象

在这里插入图片描述

MindSearch

在这里插入图片描述

茴香豆

在这里插入图片描述
至此,书生大模型实训营第4期基础岛第一关任务完成~

标签:实训营,评测,模型,书生,开源,数据,浦语
From: https://blog.csdn.net/weixin_54052852/article/details/143666312

相关文章

  • 使用YOLO 模型进行线程安全推理
    使用YOLO模型进行线程安全推理一、了解Python线程二、共享模型实例的危险2.1非线程安全示例:单个模型实例2.2非线程安全示例:多个模型实例三、线程安全推理3.1线程安全示例四、总结4.1在Python中运行多线程YOLO模型推理的最佳实践是什么?4.2为什么每个线程都要有......
  • Word2Vec,此向量维度,以及训练数据集单条数据的大小,举例说明;Skip-gram模型实现词嵌入;热
    目录Word2VecWord2Vec,此向量维度,以及训练数据集单条数据的大小,举例说明一、Word2Vec的词向量维度二、训练数据集单条数据的大小综上所述热编码(One-HotEncoding)和词向量一、表示方式二、维度与计算效率三、语义捕捉能力四、举例说明Skip-gram模型实现词嵌入Skip-g......
  • 推荐模型梳理
    Summary目录Summary标准序列推荐模型其他推荐模型FPMCDNN(Pooling)GRU4Rec(RNN-based)GRU4Rec+(RNN-based)Caser(CNN-based)SASRec(Transformer-based)DIN(Transformer-based)BERT4Rec(Transformer-based)TiSASRec(Transformer-based)FMLP-Rec(Transformer-based)CLS4Rec(ContrastiveLearnin......
  • 刚入门大模型该如何快速上手?
    前言在AI技术日新月异的今天,大模型成为了引领科技浪潮的明星产品。它们凭借强大的数据处理能力和深度学习能力,正在改变着我们的工作和生活方式。对于初学者来说,如何快速上手大模型,成为了一个迫切而又具有挑战性的问题。前排提示,文末有大模型AGI-CSDN独家资料包哦!一、了......
  • 大模型携手AI原生应用融入全产业场景
    前言10月17日,百度世界2023在北京首钢园召开。百度集团执行副总裁、百度智能云事业群总裁沈抖宣布,对“云智一体”的战略内涵全面升级,即云智一体,深入产业,生态繁荣,AI普惠。重磅发布“千帆AI原生应用开发工作台”,加速企业AI原生应用落地;发布了国内首个AI原生应用商店;面向企业落......
  • siliconflow免费使用大模型平台
    siliconflow硅基流动是一家专注于大规模AI计算的技术公司,提供高性能LLM推理和训练解决方案,助力企业高效部署AI应用。最重要的是平台可以有众多免费大模型可以使用,免费的模型涵盖文本生成、向量&重排序模型、图片生成、多模态大模型等各种模型。除此之外,目前注册可获的2000......
  • 如何在云服务器上配置ollama、部署llama3.2大语言模型
    本项目是在NVIDIAGeForceRTX4090云服务器的Ubuntu22.04系统上运行系统环境为:Python3.12、Pytorch2.4.0、CUDA12.1、cuDNN8、NVCC通过VNC远程连接到服务器,服务器的租赁是在矩池云官网上。一、服务器租赁登录到矩池云官网选择亚太一区,选择RTX4090服务器,点击租用,等......
  • 学术新趋势:深度融合迁移学习与多模态技术,推动模型性能极限突破
    2024深度学习发论文&模型涨点之——迁移学习+多模态迁移学习是指将一个领域或任务中获得的知识应用到另一个相关领域或任务中的方法。其主要优势在于可以减少对大量训练数据的需求,并提高模型在新任务上的性能。多模态学习是指在不同类型的数据(如图像、文本、音频等)之间共享知......
  • 【大模型应用开发 动手做AI Agent】Agent的感知力:语言交互能力和多模态能力
    AIAgent,语言交互,多模态感知,大模型应用,自然语言处理,计算机视觉1.背景介绍在人工智能领域,AIAgent(智能代理)作为一种能够感知环境、做出决策并与环境交互的智能体,扮演着越来越重要的角色。一个强大的AIAgent需要具备敏锐的感知能力,才能有效地理解和响应周围世......
  • DAY109代码审计-PHP模型开发篇&动态调试&反序列化&变量覆盖&TP框架&原生POP链
    知识点1、PHP审计-动态调试-变量覆盖2、PHP审计-动态调试-原生反序列化3、PHP审计-动态调试-框架反序列化PHP常见漏洞关键字SQL注入:selectinsertupdate deletemysql_querymysqli等文件上传:$_FILES,type="file",上传,move_uploaded_file()等XSS跨站:printprint_r......