首页 > 其他分享 >Index-1.9B: 哔哩哔哩自主研发的轻量级多语言大模型

Index-1.9B: 哔哩哔哩自主研发的轻量级多语言大模型

时间:2024-10-12 14:24:24浏览次数:8  
标签:Index 模型 args 1.9 哔哩 path model 轻量级

Index-1.9B模型简介
Index-1.9B是哔哩哔哩自主研发的一款轻量级多语言大模型系列,包含以下几个版本:

Index-1.9B base: 基础模型,具有19亿非嵌入参数,在2.8T主要为中英文的语料上进行预训练,在多项评测基准上领先同级别模型。
Index-1.9B pure: 基础模型的对照版本,参数和训练策略相同,但从语料中严格过滤掉所有指令相关数据,用于验证指令对基准测试的影响。
Index-1.9B chat: 基于Index-1.9B base进行SFT和DPO对齐的对话模型。由于预训练中引入了大量互联网社区语料,该模型相比同级别模型具有更有趣的聊天能力和更强的多语言(尤其是东亚语言)翻译能力。
Index-1.9B character: 在SFT和DPO基础上引入RAG技术,实现少样本角色扮演定制。
Index-1.9B模型在轻量化的同时保持了优秀的性能,为用户提供了灵活多样的应用选择。接下来我们将详细介绍该模型的评测结果、下载方式和使用方法。

模型评测结果
Index-1.9B在多项评测基准上表现优异,以下是与其他同级别及更大规模模型的对比结果:

模型 平均分 英语平均分 MMLU CEVAL CMMLU HellaSwag Arc-C Arc-E
Google Gemma 2B 41.58 46.77 41.81 31.36 31.02 66.82 36.39 42.07
Phi-2 (2.7B) 58.89 72.54 57.61 31.12 32.05 70.94 74.51 87.1
Qwen1.5-1.8B 58.96 59.28 47.05 59.48 57.12 58.33 56.82 74.93
Qwen2-1.5B(report) 65.17 62.52 56.5 70.6 70.3 66.6 43.9 83.09
MiniCPM-2.4B-SFT 62.53 68.75 53.8 49.19 50.97 67.29 69.44 84.48
Index-1.9B-Pure 50.61 52.99 46.24 46.53 45.19 62.63 41.97 61.1
Index-1.9B 64.92 69.93 52.53 57.01 52.79 80.69 65.15 81.35
Llama2-7B 50.79 60.31 44.32 32.42 31.11 76 46.3 74.6
Mistral-7B (report) / 69.23 60.1 / / 81.3 55.5 80
从评测结果可以看出,Index-1.9B在总体平均分和英语平均分上表现优异,甚至超过了一些参数量更大的模型。特别是在HellaSwag、Arc-C和Arc-E等测试上,Index-1.9B展现出了强大的性能。这些结果充分证明了Index-1.9B在轻量化的同时,仍然保持了卓越的语言理解和生成能力。

模型下载
Index-1.9B系列模型可以从以下渠道下载:

模型 HuggingFace ModelScope
Index-1.9B-Chat

标签:Index,模型,args,1.9,哔哩,path,model,轻量级
From: https://www.cnblogs.com/dongai/p/18460450

相关文章

  • AOT漫谈专题(第二篇): 如何对C# AOT轻量级APM监控
    一:背景1.讲故事上一篇我们聊到了如何调试.NETNativeAOT程序,这是研究一个未知领域知识的入口,这篇我们再来看下如何对NativeAOT程序进行轻量级的APM监控,当然这里的轻量级更多的是对AOT中的coreclr内容的挖掘。二:如何轻量级APM监控1.一个简单的例子用一个不断的往内存......
  • vue ui创建项目报错:Cannot read property 'indexOf' of undefined解决方法
    本来以为是个很简单的小报错,在网上搜了几个教程竟然都没有解决,整了快半个小时,越整越烦躁。最后忍无可忍重新安装了一遍nodejs,竟然还报这个错...突然想到自己一直没去看详细的报错日志,于是在黑窗看了一下报错内容:原来是权限不够(注:之前用系统管理员身份运行过,创建项目那里目录一......
  • 无水印下载抖音、小红书、哔哩哔哩、知乎等视频
    一、无水印下载抖音、小红书、哔哩哔哩、知乎等视频原理无水印下载抖音、小红书、哔哩哔哩、知乎等视频原理本质就是将分享内容的的链接发送到解析服务器进行解析处理,待解析完毕,服务器生成临时链接供用户下载。二、无水印下载抖音、小红书、哔哩哔哩、知乎等视频示例1、复制......
  • .NET 工控网关 轻量级组态软件
    前言C#工控网关+轻量级组态软件。项目介绍SharpSCADA是一个开源项目,提供灵活且强大的解决方案,以满足工业自动化和监控的需求。作为一个轻量级的工业控制网关和组态软件,SharpSCADA支持多种工业协议,包括西门子的Profinet、AB的EtherNet/IP、施耐德的Modbus以及OPC等......
  • 【Qt】QStandardItem和QStandardItemModle以及QModelIndex的关系
    在Qt框架中,QStandardItem、QStandardItemModel和QModelIndex是用来处理表格和数据视图的关键类。以下是它们之间的关系和用途:QStandardItemQStandardItem是QStandardItemModel中用来表示单个项的类。它可以包含数据(如文本、图标、复选框状态等)和子项(用于树结构)。QSt......
  • 一个适用于 ASP.NET Core 的轻量级插件框架
    前言今天大姚给大家分享一个适用于ASP.NETCore的轻量级插件框架,简单配置,开箱即用:PluginCore。项目概述PluginCore是一个基于ASP.NETCore的轻量级插件框架,旨在简化插件的集成与管理。通过最少的配置,开发者可以快速集成并专注于业务逻辑的开发。它支持动态WebAPI、插件隔......
  • NanoDet-Plus: 超快速轻量级无锚点目标检测模型
    NanoDet-Plus:超快速轻量级无锚点目标检测模型NanoDet-Plus是一个超快速、高精度的轻量级无锚点目标检测模型,由RangiLyu开发并开源。它在保持高检测精度的同时,具有极小的模型体积和极快的推理速度,可以在移动设备上实现实时目标检测。主要特点NanoDet-Plus具有以下突出特点:......
  • YOLO11改进|卷积篇|引入轻量级自适应提取卷积LAE
    目录一、【LAE】卷积1.1【LAE】卷积介绍1.2【LAE】核心代码二、添加【LAE】卷积机制2.1STEP12.2STEP22.3STEP32.4STEP4三、yaml文件与运行3.1yaml文件3.2运行成功截图一、【LAE】卷积1.1【LAE】卷积介绍下图是【LAE】卷积的结构图,让我们简单分析一下运行过程......
  • CherryPy :一个轻量级的 Python Web 框架
    CherryPy是一个用于构建Web应用的微框架。它通过简洁的API和强大的功能,使开发者能够快速创建高性能的Web应用。在生物信息开发中,数据库搭建和模型部署等场景可能会用到,因此记录下。学习资源官方文档:https://docs.cherrypy.dev/en/latest/GitHub项目:https://github.......
  • 如何解决 构建dotnet docker镜像时报错:error NU1301: Unable to load the service ind
    我用的是dockerdesktop,Builders设置:desktop-linux以下是我的dotnet项目的Dockerfile内容FROMmcr.microsoft.com/dotnet/aspnet:6.0ASbaseWORKDIR/appEXPOSE80EXPOSE443FROMmcr.microsoft.com/dotnet/sdk:6.0ASbuildWORKDIR/srcCOPY["NuGet.Config","......