首页 > 其他分享 >书生浦语LLM全链路开源体系笔记

书生浦语LLM全链路开源体系笔记

时间:2024-03-31 17:56:06浏览次数:19  
标签:模型 InternLM2 书生 开源 InternLM LLM 链路 浦语

书生浦语LLM全链路开源体系

LLM介绍

  1. 大模型LLM成为发展通用人工智能的重要途径。

  2. 专用模型:针对特定人物,一个模型解决一个问题;通用大模型:一个模型应对多种任务、多种模态。

书生浦语LLM发展历程及LM2

  1. InternLM -> InternLM-7B开源 + 全链路开源工具体系 -> 书生万卷1.0多模态预训练语料库 -> InternLM-Chat-7B + 开源智能体框架Lagent -> InternLM 123B参数量 -> InternLM-20B开源 +开源工具链升级 -> InternLM 2开源

  2. InternLM2分为三个参数量级别7B、20B、123B,并且每个规格包含InternLM2-Base、InternLM2、InternLM2-Chat三个模型版本,各有偏重。

  3. InternLM2回归语言建模本质,通过新一代数据清洗技术对高质量语料进行学习,有更好的建模能力。

  4. LM2的亮点:超长上下文、结构化创作能力强、强大内生计算能力及数理能力。

  5. 在综合性上,LM2-7B和LM2-20B的能力均达到同量级开源模型领先水平。

从模型到应用的流程

  1. 模型选型(评测)

  2. 考虑业务场景是否复杂

  3. 如果业务场景复杂则对参数进行微调、续训

  4. 根据是否需要与环境交互判断是否需要构建智能体,或者直接对模型进行评测部署

书生浦语全链条开源开放体系

  1. 数据:开源数据集:书生万卷1.0 + 书生万卷CC

  2. 预训练:预训练框架:InternLM-Train、Intern-eval ->高拓展性、性能优化、主流技术兼容...

  3. 微调:微调框架:Xtuner ->多微调算法、多开源生态、自优化加速、硬件适配广...

  4. 部署:全流程解决方案:LMDeploy ->接口、轻量化、推理引擎、服务...

  5. 评测:评测体系:OpenCompass2.0司南大模型 -> CompassRank性能榜单、CompassKit评测全栈工具链、CompassHub评测基准社区...

  6. 应用:智能体框架及智能体工具箱:Lagent、AgentLego -> 支持多种类型智能体能力及多种大语言模型

标签:模型,InternLM2,书生,开源,InternLM,LLM,链路,浦语
From: https://www.cnblogs.com/LPF05/p/18106996/lpf-internlm-task1

相关文章

  • JINGWHALE ABCDE 概念模型系统设计建模法,帮你规范系统产品设计,打造全链路的产品体验!
    《一种基于概念模型思想的ABCDE系统设计建模法的研究与应用》张云龙(JINGWHALE数字科学艺术创新中心,浙江杭州,310008)国作登字-2023-A-00087399摘要:本文基于概念模型思想提出了一种归纳设计纲领、梳理业务模型、抽象概念模型、具象设计模型、评估改进模型的ABCDE概......
  • InternLM2 Demo初体验-书生浦语大模型实战营学习笔记2
    本文包括第二期实战营的第2课内容。本来是想给官方教程做做补充的,没想到官方教程的质量还是相当高的,跟着一步一步做基本上没啥坑。所以这篇笔记主要是拆解一下InternStudio封装的一些东西,防止在本地复现时出现各种问题。搭建环境首先是搭建环境这里,官方教程说:进入开发机后,在`t......
  • [InternLM训练营第二期笔记]1. 书生·浦语大模型全链路开源开放体系
    由于想学习一下LLM相关的知识,真好看到上海AILab举行的InternLM训练营,可以提高对于LLM的动手能力。每次课堂都要求笔记,因此我就想在我的CSDN上更新一下,希望和感兴趣的同学共同学习~本次笔记是第一节课,介绍课。课程视频:BilibiliInternLM2Technicalreport:arxiv1.......
  • 大语言模型(LLM)
    大语言模型LLM人工智能ArtificialIntelligence一门研究如何使计算机能够模拟和执行人类智能任务的科学和技术领域是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工:计算机来模拟人智能:人的某些思维过程和智能行为(如学习、......
  • 【计算机网络篇】数据链路层(4.2)可靠传输的实现机制
    文章目录......
  • LLMRec论文阅读笔记
    LLMRec论文阅读笔记Abstract​ 长期以来,数据稀疏性的问题一直是推荐系统中的一个挑战,以前的研究都试图通过合并侧边信息来解决这个问题。然而,这种方法经常会引入副作用,如噪声、可用性问题和低数据质量,这反过来会阻碍用户偏好的准确建模,并对推荐性能产生不利影响。鉴于大型语言模......
  • NVIDIA H200 创下 MLPerf LLM 最新推理记录
    NVIDIAH200TensorCoreGPU和NVIDIATensorRT-LLM创下MLPerfLLM最新推理记录生成式人工智能正在解锁新的计算应用程序,通过持续的模型创新来极大地增强人类的能力。生成式AI模型(包括大型语言模型(LLM))用于制作营销文案、编写计算机代码、渲染详细图像、创作音......
  • centos8.2 创建链路聚合mode4的 也就是bond4
    网卡数据链路层负载均衡是使用mode4,且可以实现物理链路间互备,提供给用户的是一个逻辑上的链路,该逻辑链路的有效网络带宽为全部物理链路带宽之和。Bondingmode4的一些特性:最多支持绑定8个主机的网卡端口;LACP控制协议数据包每秒发送一次,检测主机网卡是否存活的检测包每30秒(fast)......
  • 逻辑链路控制与适配协议(L2CAP)
    逻辑链路控制与适配协议通常简称为L2CAP(LogicalLinkControlandAdaptationProtocol),它向上连接应用层,向下连接控制器层,发挥主机与控制器之间的适配器的作用,使上层应用操作无需关心控制器的数据处理细节。经典蓝牙的L2CAP层比较复杂,它实现了协议复用、数据分段与重组、封装......
  • 【网络】:数据链路层
    数据链路层一.以太网帧格式二.认识MTU三.ARP协议1.ARP协议的工作流程2.ARP数据报的格式3.ARP欺骗四.其他重要协议或技术1.DNS2.ICMP协议3.NAT技术(重点)4.代理服务器五.一些问题认识以太网“以太网”不是一种具体的网络,而是一种技术标准;既包含了数据链路层的内......