首页 > 其他分享 >北理工开源MindLLM-1.3B:超越大小,中英双语对话新标杆

北理工开源MindLLM-1.3B:超越大小,中英双语对话新标杆

时间:2024-01-27 11:07:35浏览次数:26  
标签:训练 1.3 AI 模型 北理工 英双语 对话 MindLLM

引言

在人工智能的发展浪潮中,自然语言处理技术的进步尤为引人注目。特别是大型语言模型(LLM),在推动语言理解和生成领域取得显著成就。北京理工大学-东南信息研究院自然语言处理团队的最新力作MindLLM-1.3B模型,在中英双语对话处理上实现了重大突破。

MindLLM-1.3B模型概述

MindLLM-1.3B是一款基于13亿参数的大型语言模型。该模型主要聚焦于中文对话任务,并通过有监督训练进行了优化。模型在轻量化设计下实现了快速部署和高效推理,特别适用于资源受限的场景,如车载系统和移动设备等。自发布以来,它在Hugging Face平台仅一个月内便获得超3000次下载,足以证明其在业界的影响力。

  • Huggingface模型下载:https://huggingface.co/bit-dny/MindLLM-1b3-chat-zh-v2.0
  • AI快站模型免费加速下载:https://aifasthub.com/models/bit-dny

北理工开源MindLLM-1.3B:超越大小,中英双语对话新标杆_人工智能

技术背景与优势

MindLLM-1.3B在中英双语上进行预训练,体现了该模型在处理双语数据方面的强大能力。在与其他大型模型的比较中,例如MPT-7B和GPT-J-6B,MindLLM-1.3B在多项评测中表现出色。具体而言,在MMLU和AGIEval评测中,未经指令微调和对齐的MindLLM在性能上优于上述大型模型。在中文语境下,该模型在C-Eval和CMMLU评测中表现相当,甚至在某些方面超越了更大规模的模型。

北理工开源MindLLM-1.3B:超越大小,中英双语对话新标杆_人工智能_02

模型对话能力训练

MindLLM-1.3B的训练材料包括丰富的中文指令数据,涵盖了人工标注、NLP数据模板转换、以及LLM生成等多种数据构造方式。团队通过精细的数据筛选和处理,构建了包含超过两千万条中文对话数据的庞大数据集,覆盖了从日常闲聊到语言处理、代码编程、书写辅助等多个领域。

北理工开源MindLLM-1.3B:超越大小,中英双语对话新标杆_数据_03

训练细节与创新

在训练过程中,MindLLM-1.3B采用了<user>和<assistant>标记来区分用户和AI助手的角色。多轮对话通过模板组织,并以EOS token作为分隔。训练目标旨在使模型能够基于历史对话预测期望输出,进而提高对话生成的准确性和连贯性。

此外,模型还采用了数据并行和混合精度技术进行训练。设置合适的学习率和预热步长,使得在仅四天的时间内完成了全量参数微调。

部署效果与应用场景

经过训练和优化后,MindLLM-1.3B成功在资源受限的设备上进行部署。实验表明,MindLLM-Chat仅需12G显存即可实现部署,并且推理速度远超更大规模的模型。这一特性使得MindLLM-1.3B成为移动设备和车载系统等资源受限环境中理想的选择。

结论

MindLLM-1.3B模型的发布标志着轻量级大语言模型在普及人工智能技术方面迈出了重要一步。其在技术性能、应用范围和易用性上的优势,为未来AI技术的发展和应用提供了新的思路和可能性。随着这类模型的不断发展,我们可以期待AI技术在更多领域的广泛应用和普及。

模型下载

Huggingface模型下载

https://huggingface.co/bit-dny/MindLLM-1b3-chat-zh-v2.0


标签:训练,1.3,AI,模型,北理工,英双语,对话,MindLLM
From: https://blog.51cto.com/u_16323307/9441627

相关文章

  • 算法模板 v1.3.2.20240124
    算法模板v1.1.1.20240115:之前的历史版本已经不可寻,创建了第一份算法模板。v1.2.1.20240116:删除“编译”-“手动开栈”与“编译”-“手动开O优化”;将“编译”-“CF模板”中的第20行代码cin>>T;注释;删除“读写”及其目录下的内容;删除“图论”-“欧拉图”-“混合图”;删除“图论”-......
  • 【2024潇湘夜雨】WIN11_Pro_23H2.22631.3078软件选装纯净版1.19
    【系统简介】=============================================================1.本次更新母盘来自WIN11_Pro_23H2.22631.3078。2.增加部分优化方案,手工精简部分较多。3.OS版本号为22631.3078。精简系统只是为部分用户安装,个别要求高的去MSDN下。4.集成《DrvCeo-2.15.0.5》网卡版、......
  • CDH6.3.2下安装部署Qualitis数据质量分析的计算服务Linkis1.3.2
    快速搭建Qualitis手册一、基础软件安装Gradle(4.6)MySQL(5.5+)JDK(1.8.0_141)Linkis(1.0.0+),必装Spark引擎。如何安装LinkisDataSphereStudio(1.0.0+)可选.如果你想使用工作流,必装DataSphereStudio如何安装DataSphereStudio?(1)安装Gradle(4.6)腾讯云镜像:http......
  • 算法模板 v1.3.1.20240120
    算法模板v1.1.1.20240115:之前的历史版本已经不可寻,创建了第一份算法模板。v1.2.1.20240116:删除“编译”-“手动开栈”与“编译”-“手动开O优化”;将“编译”-“CF模板”中的第20行代码cin>>T;注释;删除“读写”及其目录下的内容;删除“图论”-“欧拉图”-“混合图”;删除“图论”-......
  • 【更新公告】Airtest更新至1.3.3版本
    此文章来源于项目官方公众号:“AirtestProject”版权声明:允许转载,但转载必须保留原链接;请勿用作商业或者非法用途1.前言本次更新为Airtest、Poco库更新,Airtest版本提升至1.3.3版本,Poco版本提升至1.0.94版本,主要是Airtest新增点击和滑动的相对坐标支持,Poco修复了1.0.93运行......
  • 【2024潇湘夜雨】WIN11_Pro_23H2.22631.3007软件选装纯净版1.12
    【系统简介】=============================================================1.本次更新母盘来自WIN11_Pro_23H2.22631.3007。2.增加部分优化方案,手工精简部分较多。3.OS版本号为22631.3007。精简系统只是为部分用户安装,个别要求高的去MSDN下。4.集成《DrvCeo-2.15.0.5》网卡版、......
  • Sermant重磅更新,1.3.0 release版本发布
    本文分享自华为云社区《新特性速览!Sermant重磅更新,1.3.0release版本发布》,作者:华为云开源。Sermant社区在12月份正式发布了1.3.0release版本,这次更新中,Sermant新增服务治理插件:消息队列禁止消费插件。该插件允许在微服务运行时动态地控制消费者(如Kafka、RocketMQ)的消费行为,实现禁......
  • Sermant重磅更新,1.3.0 release版本发布
    本文分享自华为云社区《新特性速览!Sermant重磅更新,1.3.0release版本发布》,作者:华为云开源。Sermant社区在12月份正式发布了1.3.0release版本,这次更新中,Sermant新增服务治理插件:消息队列禁止消费插件。该插件允许在微服务运行时动态地控制消费者(如Kafka、RocketMQ)的消费行为,实现......
  • H6225L 降压恒压芯片 输入8V-60V降压12V 60V降压5V 60V降压3.3V/1.3A
    H6225L是一种内置85V耐压MOS,支持输入高达72V的高压降压开关控制器,可以向负载提供1.3A的连续电流。H6225L支持输出恒定电压,可以通过调节VFB采样电阻来设置输出电压,同时支持最大电流限制,可以通过修改CS采样电阻来设置输出电流最大值。典型开关频率为130KHz,设计有最小开关频率5KHz,可以......
  • 大二打卡(11.30)
    今天做了什么:平平无奇的周四,上着令人痛苦的满课,uml今天是第二个实验,体育课,哎,练了跟没练似的,接也接不住,传也传不过去,发球好像发过去了吧,也不知道,因为是网下练习的,没有网子标着,感觉很费劲,下午数据结构,今天的提问环节还行,都能自己回答上来,毕竟老师每节课开头前三四十分钟,都带着我们......