首页 > 其他分享 >MLPerf踩坑记

MLPerf踩坑记

时间:2024-10-22 10:20:43浏览次数:1  
标签:坑记 run cm -- spack MLPerf env xz

inference

MLPerf Steps

Install CM

python3 -m venv cm
source cm/bin/activate
pip install cm4mlops

Setup a virtual environment for Python

cm run script --tags=install,python-venv --name=mlperf
export CM_SCRIPT_EXTRA_CMD="--adr.python.name=mlperf"

Problem

Our xz installed by spack have some problem.

(cm) [rocky@scc112-cpu2 ~]$ ldd /home/rocky/spack/opt/spack/linux-rocky9-zen3/gcc-11.4.1/xz-5.4.6-54q5irsngvod5psb7bhas6tklpiztmcz/bin/xz
ldd: /home/rocky/spack/opt/spack/linux-rocky9-zen3/gcc-11.4.1/xz-5.4.6-54q5irsngvod5psb7bhas6tklpiztmcz/bin/xz: No such file or directory
(cm) [rocky@scc112-cpu2 ~]$ file /home/rocky/spack/opt/spack/linux-rocky9-zen3/gcc-11.4.1/xz-5.4.6-54q5irsngvod5psb7bhas6tklpiztmcz/bin/xz
/home/rocky/spack/opt/spack/linux-rocky9-zen3/gcc-11.4.1/xz-5.4.6-54q5irsngvod5psb7bhas6tklpiztmcz/bin/xz: cannot open /home/rocky/spa

So we use yum to install and change the PATH.

yum install xz
export PATH=/usr/bin:$PATH

The script to generate actual submission tree check the test_query_count no less than 10833, so we change it in the script.

Optimize

performance run:

taskset -c 0-31 cm run script --tags=run-mlperf,inference,_find-performance,_full,_r4.1-dev \
   --model=bert-99 \
   --implementation=reference \
   --framework=deepsparse \
   --category=edge \
   --scenario=Offline \
   --execution_mode=test \
   --device=cpu  \
   --quiet \
   --test_query_count=60833\
   --env.CM_MLPERF_NEURALMAGIC_MODEL_ZOO_STUB=zoo:nlp/question_answering/mobilebert-none/pytorch/huggingface/squad/base_quant-none \
   --batch_size=64 \
   --env.OMP_NUM_THREADS=32

accuracy run:

taskset -c 0-31 cm run script --tags=run-mlperf,inference,_r4.1-dev \
   --model=bert-99 \
   --implementation=reference \
   --framework=deepsparse \
   --category=edge \
   --scenario=Offline \
   --execution_mode=valid \
   --device=cpu \
   --quiet \
   --env.CM_MLPERF_NEURALMAGIC_MODEL_ZOO_STUB=zoo:nlp/question_answering/mobilebert-none/pytorch/huggingface/squad/base_quant-none \
   --batch_size=64 \
   --env.OMP_NUM_THREADS=32 \
   --test_query_count=10833 

We use taskset -c 0-31 to bind the process to CPU cores 0 to 31 to avoid performance loss due to switching between different cores.

We choice deepsparse as the framework since it has higher performance.

We try different batch_size and finally choice 64 to get the highest performance.

We choice 32 OMP_NUM_THREADS since our machine has 32 cores and Thread(s) per core is 1.

Submit

We change env.CM_FRAMEWORK as deepsparse.

cm run script --tags=generate,inference,submission \
   --clean \
   --preprocess_submission=yes \
   --run-checker \
   --tar=yes \
   --env.CM_TAR_OUTFILE=submission.tar.gz \
   --division=open \
   --category=edge \
   --env.CM_DETERMINE_MEMORY_CONFIGURATION=yes \
   --run_style=valid \
   --quiet \
   --submitter=scc112 \
   --env.CM_FRAMEWORK=deepsparse \
   --hw_name="scc112-cpu2"

标签:坑记,run,cm,--,spack,MLPerf,env,xz
From: https://www.cnblogs.com/linjiale/p/18492033

相关文章

  • 高精度计算库math.js使用踩坑记
    前情最近在做一个后端需求,需求中需要前端做一些金额数字计算,前端对于小数的计算一直都有精度问题,如0.1+0.2计算的结果并不是0.3,而是0.30000000000000004,于是引入高精度计算库math.js来解决前端计算的精度问题。坑位这次做的需求是一个退货扣款的需求,如果用户退回来的商品有磨......
  • 【Golang】踩坑记录:make()创建引用类型,初始值是不是nil!!
    文章目录起因二、得记住的知识点1.make()切片,初始化了吗?2.make()切片不同长度容量,append时的差别3.切片是指向数组的指针吗?4.切片扩容时,重新分配内存,原切片的数据怎么办?三、咳咳,总结一下起因序列化的时候居然给我空指针报错,哪nil啦???猛一顿查,查到了创建的结构体......
  • 【子项目:命令系统(Command System)】C++自制命令系统( 开发ing | 踩坑记录 )
    项目背景在某一项目中,遇到了需要自制命令系统的需求,而这个模块的复用性很高,因此单独拉出来做一个子项目更新日志[2024.10.15-10:00]增项目进度----[2024.10.1510:00]----首先实现最基础的输入输出功能,用std::getline读入行再分割成字符串数组-main.cpp#include......
  • docker+Hexo踩坑记
    起因前段时间博客园差点寄了,在高中时曾经用Hexo+GithubPages搭建过博客,但因为各种原因停止服务了,现在打算做个docker镜像作为hexo的服务端,这样以后更换服务器就可以很方便的部署了。前期最开始的想法是在镜像里塞hexo,每次更新文章的时候去容器里更新,整一套流程全部都在容器里,......
  • [OS Project0] Pintos踩坑记
    本地构建起因有些学长在上课前的假期就已经把OS所有的Project做完了,加上还未分配配好环境的虚拟机给我们,所以在开学前尝试本地构建Problems在安装bochs的时候遇到了很多问题,并未记录,最终成功构建bochs但是bochs-gbd未成功,报错为找不到gdb的print。docker构建感谢伟大的艾博......
  • TEN Framework 入坑记
    TL;DRTENFramework最初叫Astra,后改为TEN,即TransformativeExtensionsNetwork。我第一次见到TEN(那时还叫Astra)是在今年的6月份的极客公园AGIPlayground大会RTEOpenDay的活动上。当时展区现场人声嘈杂,但对话效果已经很不错。当时我们在展示用XSwitch支持多模态......
  • X86超云服务器安装麒麟操作系统踩坑记
    在项目现场用U盘安装X86架构超云服务器麒麟操作系统进行了两天才装好,就是之前的资料一个挂载方式需要从RW修改为RO一、复现步骤操作系统版本:银河麒麟高级服务器操作系统Kylin-Server-10-SP2-x86-Release-Build09-20210524.iso(x86_64)使用Rufus工具制作U盘启动盘;修改启动项,选择从U盘......
  • Mybatis踩坑记录:探究Mybatis源码为何当传入参数Integer类型为0时,if条件生效
    目录前言 ​编辑问题背景 深入源码 解决问题方案一方案二方案三 结果结语前言在MyBatis中,<if>标签用于动态生成SQL查询条件。然而,在一些特定的场景下,<if>标签的条件判断可能会出现意料之外的结果。例如,当传入的Integer参数为0时,条件判断可能不会如......
  • 【模仿学习代码复现】环境安装踩坑记录
    (这人怎么又在装环境)下载了一下OpenAI的论文代码,官方readme里的依赖设置如下:*OpenAIGym>=0.1.0,mujoco_py>=0.4.0*numpy>=1.10.4,scipy>=0.17.0,theano>=0.8.2*h5py,pytables,pandas,matplotlib前面都好好的,装到theano突然发现这破玩意不支持3.6及以上版本,......
  • 光影精灵10 Win1+Ubuntu18.04 双系统 踩坑记录
    前言第二年准备报名智能车了,当然还是创意组别。刚好买了今年新出的电脑光影精灵10,我想着也给它安一个双系统。但是没想到,相比于之前那个老电脑,新电脑的新硬件和驱动问题远比老电脑麻烦的多。在经历了一系列踩坑和疯狂查资料之后,加上重装系统N次,终于成功下车。遂把过程记录下来,以......