首页 > 其他分享 >使用MindFormers本地部署大模型

使用MindFormers本地部署大模型

时间:2024-09-10 08:51:56浏览次数:11  
标签:run -- docs 模型 MindFormers 本地 generate

MindSpore Transformers即时MindFormers套件的目标是构建一个大模型训练、微调、评估、推理、部署的全流程开发套件,提供业内主流的Transformer类预训练模型和SOTA下游任务应用,涵盖丰富的并行特性。期望帮助用户轻松的实现大模型训练和创新研发。

安装MindFormers

直接使用pip安装

pip install mindformers

有时候训练或推理还需要源代码,那就git clone下载:

git clone https://portrait.gitee.com/huanglei_Sorry/mindformers

支持的模型如下

当前MindFormers支持的模型列表如下:

模型参数序列预训练微调推理LoRA对话评估
LLaMA27B4KgeneratePPL
13B4KgeneratePPL
70B4KgeneratePPL
LLaMA38B8K-generate--
70B8Kgenerate--
Baichuan27B4K-generatePPL
13B4K-generatePPL
GLM26B2K-generatePPL / Rouge
GLM36B2K-generate--
GLM3-32K6B32K-generate--
Qwen7B8K-docsC-Eval
14B8K-docsC-Eval
Qwen1.57B32Kdocs--
14B32Kdocs--
72B32Kdocs--
QwenVL9.6B2K-generate--
InternLM7B2K-generatePPL
20B2K-generatePPL
InternLM27B2K-generate--
20B4K--generate--
Yi6B2K-generate-
34B4Kgenerate-
Mixtral8x7B32Kdocs-
DeepSeek Coder33B4K-docs-
CodeLlama34B4KgenerateHumanEval
GPT213B2KgeneratePPL

使用示例

# 1. 单机多卡快速启动方式,默认8卡启动
bash scripts/msrun_launcher.sh "run_mindformer.py \
  --config {CONFIG_PATH} \
  --run_mode {train/finetune/eval/predict}"

# 2. 单机多卡快速启动方式,仅设置使用卡数即可
bash scripts/msrun_launcher.sh "run_mindformer.py \
  --config {CONFIG_PATH} \
  --run_mode {train/finetune/eval/predict}" WORKER_NUM

# 3. 单机多卡自定义启动方式
bash scripts/msrun_launcher.sh "run_mindformer.py \
  --config {CONFIG_PATH} \
  --run_mode {train/finetune/eval/predict}" \
  WORKER_NUM MASTER_PORT LOG_DIR JOIN CLUSTER_TIME_OUT

标签:run,--,docs,模型,MindFormers,本地,generate
From: https://blog.csdn.net/skywalk8163/article/details/142071832

相关文章

  • AI绘画——从扩散模型到创意无限
    AI绘画魅力四射 如果在两年前我说这些图片是AI生成的,你或许会说我痴人说梦话,但经过了2023年AI绘画热潮后,大量精致而逼真的AI绘画在互联网上铺天盖地。AI绘画技术的快速发展,使得生成的图像质量大幅提升,很多作品已经达到了以假乱真的地步。生成模型一览众山这张图通过将......
  • 【LLM训练系列】从零开始训练大模型之Phi2-mini-Chinese项目解读
    一、前言本文主要是在复现和实践Phi2-mini-Chinese后,简要分析下Phi2-mini-Chinese这个项目,做一个学习实战总结。原文发布于知乎:https://zhuanlan.zhihu.com/p/718307193,转载请注明出数。Phi2-mini-Chinese简介Phi2-Chinese-0.2B从0开始训练自己的Phi2中文小模型,支持接入langc......
  • 全网最细:谷歌地图三维模型提取教程
    文章目录前言一、准备环境二、以调试模式运行谷歌浏览器2.1开启硬件加速2.2安装地址查看2.3快捷方式修改2.4启动调式模式三、使用RenderDOC进行模型提取3.1模型提取3.2模型导出3.3InjectintoProcess界面调取四、使用Blender处理模型4.1导入并启用MapsModelsIm......
  • 大模型的两个重要能力 (IF + FC)
    MiniCPMhttps://github.com/OpenBMB/MiniCPM面壁智能推出的大模型,在如下方面支持能出众。推理长文本RAG都是常见的能力。其中指令遵从(IF=instructionfollow)和工具调用(FC=functioncall),威力强大,可以用作很多语音控制场景。 MiniCPM3.0MiniCPM3.0是一......
  • 小琳AI课堂:多模态模型的训练与应用
    引言大家好,这里是小琳AI课堂。今天我们将探讨一个热门且前沿的话题——多模态模型的训练与应用。让我们一起走进这个复杂而精致的艺术创作过程!训练关键步骤1.数据收集与预处理准备工作:从多种来源和模态收集数据,如文本、图像、音频等。处理细节:每种数据类型需经过特定......
  • git修改本地代理
    1.本人在使用gitclone别人的写好的第三方库时遇到,fatal:unabletoconnecttogithub.com:github.com[0:20.205.243.166]:errno=Unknownerror即无法克隆GitHub上的库。2.解决思路:在一些网络环境可能会禁用GitHub需要使用的端口号,所以使用本地代理,也许可以进行克隆。3.解......
  • 支持向量机模型 0基础小白也能懂(附代码)
    支持向量机模型0基础小白也能懂(附代码)原文链接啥是向量机模型本篇我们要讲解的模型是大名鼎鼎的支持向量机SVM,这是曾经在机器学习界有着近乎「垄断」地位的模型,影响力持续了好多年。直至今日,即使深度学习神经网络的影响力逐渐增强,但SVM在中小型数据集上依旧有着可以和神......
  • 第 4 章照相机模型与增强现实
    针孔照相机模型(有时称为射影照相机模型)是计算机视觉中广泛使用的照相机模型。对于大多数应用来说,针孔照相机模型简单,并且具有足够的精确度。这个名字来源于一种类似暗箱机的照相机。该照相机从一个小孔采集射到暗箱内部的光线。在针孔照相机模型中,在光线投影到图像平面之前,从......
  • VS中如何将本地代码上传到码云仓库
    VS中如何将本地代码上传到码云仓库方式一:点击“添加到源代码管理”VS底部栏点击“添加到源代码管理”,并选择“Git”选项在弹出窗口中,选择“其他→现有远程”选项,在右侧区域找到“远程URL”输入框,输入Gitee仓库地址,然后点击“创建并推送”按钮。此时项目目录会多出git文......
  • Linux下io模型
    目录一. 阻塞式IO:最常见、效率低、不耗费cpuudp丢包​编辑tcp粘包tcp拆包二.非阻塞io:轮询、耗费CPU,可以处理多路IO概念设置非阻塞的方式1.通过函数自带参数设置2.通过设置文件描述符的属性,把对应属性设置为非阻塞三. 信号驱动IO/异步IO:异步通知方式,需要底层驱动......