首页 > 其他分享 >书生·浦语大模型全链路开源体系笔记

书生·浦语大模型全链路开源体系笔记

时间:2024-05-24 18:55:10浏览次数:21  
标签:评测 高质量 模型 InternLM2 开源 链路 语料 浦语

大模型成为发展通用人工智能的重要途径

专用模型

  • 专用模型:针对特定任务,一个模型解决一个问题。
  • 通用大模型:一个模型应对多种任务、多种模态。
    在这里插入图片描述

书生·浦语大模型开源历程

在这里插入图片描述

书生·浦语 2.0(InternLM2)的体系

面向不同的使用需求 ,每个规格包含三个模型版本。

  • 7B:为轻量级的研究和应用提供了一个轻便但性能不俗的模型。
  • 20B:模型的综合性能更为强劲,可有效支持更加复杂的实用场景。
  • InternLM2-Base:高质量和具有很强可塑性的模型基座 是模型进行深度领域适配的高质量起点。
  • InternLM2:在 Base 基础上,在多个能力方向进行了强化 ,在评测中成绩优异,同时保持了很好的
    通用语言能力,是我们推荐的在大部分应用中考虑选用的优秀基座。
  • InternLM2-Chat:在 Base 基础上,经过 SFT 和 RLHF,面向对话交互进行了优化,具有很好的指令遵循、共情聊天和调用工具等的能力。

回归语言建模的本质

新一代数据清洗过滤技术

  • 多维度数据价值评估:基于文本质量、信息质量、信息密度等维度对数据价值进行综合评估与提升。
  • 高质量语料驱动的数据富集:利用高质量语料的特征从物理世界、互联网以及语料库中进一步富集更多类似语料。
  • 有针对性的数据补齐 针对性补充语料,重点加强世界知识、 数理、代码等核心能力。
    在这里插入图片描述

InternLM2的主要亮点

  • 超长上下文:模型在 20万 token上下文中,几乎完美实现“大海捞针”。
  • 综合性能、全面提升:推理、数学、代码提升显 著InternLM2-Chat-20B 在重点评测上比肩 ChatGPT
  • 优秀的对话和创作体验:精准指令跟随,丰富的结 构化创作,在AlpacaEval2超越 GPT-3.5 和Gemini Pro。
  • 工具调用能、力整体升级:可靠支持工具多轮调用复杂智能体搭建。
  • 突出的数理能力和实用的数据分析功能:强大的内生计算能力,加入代码解释后,在GSM8K 和 MATH 达到和 GPT-4 相仿水平。
    在这里插入图片描述

从模型到应用典型流程

在这里插入图片描述

书生·浦语全链条开源开放体系

  • 数据:书生·万卷,2TB数据,涵盖多种模态与任务。
  • 预训练:InternLM-Train,并行训练,极致优化速度达到 3600 tokens/sec/gpu。
  • 微调:XTuner,支持 全参数微调,支持LORA等低成本微调。
  • 部署:LMDeploy全链路部署,性能领先每秒生成 2000+ tokens 。
  • 评测:OpenCompass,全方位评测,性能可复现100 套评测集,50万道题目。
  • 应用:Lagent和AgentLego支持多种智能体,支持代
    码解释器等多种工具。

开放的高质量语料数据

在这里插入图片描述

预训练

在这里插入图片描述

微调

在这里插入图片描述
在这里插入图片描述

评测

在这里插入图片描述
在这里插入图片描述

部署

在这里插入图片描述
在这里插入图片描述

智能体

在这里插入图片描述
在这里插入图片描述
有兴趣者可以观看这个视频教程,点击即可

标签:评测,高质量,模型,InternLM2,开源,链路,语料,浦语
From: https://blog.csdn.net/qq_42137576/article/details/139182066

相关文章

  • 对话阿里云云原生产品负责人李国强:推进可观测产品与OpenTelemetry开源生态全面融合
    5月22日,在最新一期的飞天发布时刻上,阿里云宣布多款可观测产品全面升级,其中一项是应用实时监控服务ARMS在业内率先推进了与OpenTelemetry开源生态的全面融合,极大丰富了可观测的数据类型及规模,大幅增强了ARMS核心能力。本次阿里云ARMS产品全面升级的背景是什么?为什么会......
  • (开源) 写了一个无代码平台 brick
    前沿无代码开发是一种无需编写代码或通过少量代码就可以快速生成应用程序的开发平台。它可以快速交付应用程序,解决传统软件开发模式带来的周期长、成本高等问题。无代码开发平台,允许用户通过拖拽和放置组件的方式来构建应用界面。brick是一个无代码开发平台,采用React+Typescr......
  • NIUSHOP 开源商城 V6 开源版(商城+分销+VIPCard+上门服务)前端技术探索与实践
    摘要:本文深入探讨了NIUSHOPV6开源商城前端技术的选型、实现与设计理念。NIUSHOPV6作为一款优秀的企业级商城系统,其前端采用了Vite、TypeScript、Vue3及ElementPlus等最新技术栈,为开发者提供了高效、灵活的开发体验。本文将从技术选型、设计理念、插件化开发以及一键云编译......
  • CRMEB开源商城系统:全开源、高灵活性的电商解决方案
    一、引言随着电子商务的飞速发展,越来越多的企业和个人开始关注如何快速搭建一个稳定、高效且功能丰富的在线商城系统。在这样的背景下,CRMEB开源商城系统应运而生,凭借其前后端分离的架构、丰富的功能模块以及易用性,成为了众多开发者和企业的首选。本文将对CRMEB开源商城系统进......
  • 聊聊一个差点被放弃的项目以及近期的开源计划
    前言自从StarBlog和SiteDirectory之后,我还没写新的关于开源项目的系列,最近又积累了很多想法,正好写一篇博客来总结一下。关于差点被放弃的项目,就是最近一直在做的单点认证(IdentityServerLite)IdentityServerLite开发这个项目的起因,是团队的内部系统逐渐多了起来实际上之前......
  • 开源项目分享:ChatGPT 控制台聊天应用
    开源项目分享:ChatGPT控制台聊天应用分享一个我最近完成的一个小应用,一个ChatGPT的控制台聊天应用,大家都在搞AI,我也来玩一玩,顺便分享到社区,有兴趣的小伙伴可以去我的github主页下载体验。项目简介ChatGPT控制台聊天应用基于.NET8实现,一键拥有你的私人ChatGPT,支持OpenAI(Cha......
  • 9 个开源项目、25 个课题可选丨欢迎报名阿里云云原生开源之夏
    开源之夏是由中科院软件所“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,旨在鼓励在校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开发者,促进优秀开源软件社区的蓬勃发展,助力开源软件供应链建设。参与学生通过远程线上协作方式,配有资深导师指导,参与到开源......
  • 【开源可视化报表设计器】借力实现高效率流程化办公!
    进行数字化转型、实现流程化办公,这些应该是目前很多企业都想要实现的目标吧。那么,利用什么样的软件平台可以实现?低代码技术平台拥有可视化界面、灵活操作、好维护等众多优势特点,可以借助低代码技术平台、开源可视化报表设计器的优势特点,助力企业打破信息孤岛,实现高效率流程化办公......
  • netcore 开源的与插件有关的项目
    在.NETCore生态系统中,有一些开源项目可以实现类似于插件系统的功能,允许应用程序动态加载和运行扩展或模块。以下是一些值得关注的项目和框架:1.OrchardCoreOrchardCore是一个开源、模块化的应用程序框架和内容管理系统,基于ASP.NETCore构建。它提供了强大的模块化和扩展......
  • C#应用的用户配置窗体方案 - 开源研究系列文章
          这次继续整理以前的代码。本着软件模块化的原理,这次笔者对软件中的用户配置窗体进行剥离出来,单独的放在一个Dll类库里进行操作,这样在其它应用程序里也能够快速的复用该类库,达到了快速开发软件的效果。      笔者其它模块化应用的例子:      C#的关于......