MLPerf Steps

Install CM

python3 -m venv cm
source cm/bin/activate
pip install cm4mlops

Setup a virtual environment for Python

cm run script --tags=install,python-venv --name=mlperf
export CM_SCRIPT_EXTRA_CMD="--adr.python.name=mlperf"

Problem

Our xz installed by spack have some problem.

(cm) [rocky@scc112-cpu2 ~]$ ldd /home/rocky/spack/opt/spack/linux-rocky9-zen3/gcc-11.4.1/xz-5.4.6-54q5irsngvod5psb7bhas6tklpiztmcz/bin/xz
ldd: /home/rocky/spack/opt/spack/linux-rocky9-zen3/gcc-11.4.1/xz-5.4.6-54q5irsngvod5psb7bhas6tklpiztmcz/bin/xz: No such file or directory
(cm) [rocky@scc112-cpu2 ~]$ file /home/rocky/spack/opt/spack/linux-rocky9-zen3/gcc-11.4.1/xz-5.4.6-54q5irsngvod5psb7bhas6tklpiztmcz/bin/xz
/home/rocky/spack/opt/spack/linux-rocky9-zen3/gcc-11.4.1/xz-5.4.6-54q5irsngvod5psb7bhas6tklpiztmcz/bin/xz: cannot open /home/rocky/spa

So we use yum to install and change the PATH.

yum install xz
export PATH=/usr/bin:$PATH

The script to generate actual submission tree check the test_query_count no less than 10833, so we change it in the script.

Optimize

performance run:

taskset -c 0-31 cm run script --tags=run-mlperf,inference,_find-performance,_full,_r4.1-dev \
   --model=bert-99 \
   --implementation=reference \
   --framework=deepsparse \
   --category=edge \
   --scenario=Offline \
   --execution_mode=test \
   --device=cpu  \
   --quiet \
   --test_query_count=60833\
   --env.CM_MLPERF_NEURALMAGIC_MODEL_ZOO_STUB=zoo:nlp/question_answering/mobilebert-none/pytorch/huggingface/squad/base_quant-none \
   --batch_size=64 \
   --env.OMP_NUM_THREADS=32

accuracy run:

taskset -c 0-31 cm run script --tags=run-mlperf,inference,_r4.1-dev \
   --model=bert-99 \
   --implementation=reference \
   --framework=deepsparse \
   --category=edge \
   --scenario=Offline \
   --execution_mode=valid \
   --device=cpu \
   --quiet \
   --env.CM_MLPERF_NEURALMAGIC_MODEL_ZOO_STUB=zoo:nlp/question_answering/mobilebert-none/pytorch/huggingface/squad/base_quant-none \
   --batch_size=64 \
   --env.OMP_NUM_THREADS=32 \
   --test_query_count=10833

We use taskset -c 0-31 to bind the process to CPU cores 0 to 31 to avoid performance loss due to switching between different cores.

We choice deepsparse as the framework since it has higher performance.

We try different batch_size and finally choice 64 to get the highest performance.

We choice 32 OMP_NUM_THREADS since our machine has 32 cores and Thread(s) per core is 1.

Submit

We change env.CM_FRAMEWORK as deepsparse.

cm run script --tags=generate,inference,submission \
   --clean \
   --preprocess_submission=yes \
   --run-checker \
   --tar=yes \
   --env.CM_TAR_OUTFILE=submission.tar.gz \
   --division=open \
   --category=edge \
   --env.CM_DETERMINE_MEMORY_CONFIGURATION=yes \
   --run_style=valid \
   --quiet \
   --submitter=scc112 \
   --env.CM_FRAMEWORK=deepsparse \
   --hw_name="scc112-cpu2"

标签：坑记,run,cm,--,spack,MLPerf,env,xz
From： https://www.cnblogs.com/linjiale/p/18492033

高精度计算库math.js使用踩坑记
前情最近在做一个后端需求，需求中需要前端做一些金额数字计算，前端对于小数的计算一直都有精度问题，如0.1+0.2计算的结果并不是0.3,而是0.30000000000000004，于是引入高精度计算库math.js来解决前端计算的精度问题。坑位这次做的需求是一个退货扣款的需求，如果用户退回来的商品有磨......
【Golang】踩坑记录：make()创建引用类型，初始值是不是nil！！
文章目录起因二、得记住的知识点1.make()切片，初始化了吗？2.make()切片不同长度容量，append时的差别3.切片是指向数组的指针吗？4.切片扩容时，重新分配内存，原切片的数据怎么办？三、咳咳，总结一下起因序列化的时候居然给我空指针报错，哪nil啦？？？猛一顿查，查到了创建的结构体......
【子项目：命令系统（Command System）】C++自制命令系统（开发ing | 踩坑记录）
项目背景在某一项目中，遇到了需要自制命令系统的需求，而这个模块的复用性很高，因此单独拉出来做一个子项目更新日志[2024.10.15-10:00]增项目进度----[2024.10.1510:00]----首先实现最基础的输入输出功能，用std::getline读入行再分割成字符串数组-main.cpp#include......
docker+Hexo踩坑记
起因前段时间博客园差点寄了，在高中时曾经用Hexo+GithubPages搭建过博客，但因为各种原因停止服务了，现在打算做个docker镜像作为hexo的服务端，这样以后更换服务器就可以很方便的部署了。前期最开始的想法是在镜像里塞hexo，每次更新文章的时候去容器里更新，整一套流程全部都在容器里，......
[OS Project0] Pintos踩坑记
本地构建起因有些学长在上课前的假期就已经把OS所有的Project做完了，加上还未分配配好环境的虚拟机给我们，所以在开学前尝试本地构建Problems在安装bochs的时候遇到了很多问题，并未记录，最终成功构建bochs但是bochs-gbd未成功，报错为找不到gdb的print。docker构建感谢伟大的艾博......
TEN Framework 入坑记
TL;DRTENFramework最初叫Astra，后改为TEN，即TransformativeExtensionsNetwork。我第一次见到TEN（那时还叫Astra）是在今年的6月份的极客公园AGIPlayground大会RTEOpenDay的活动上。当时展区现场人声嘈杂，但对话效果已经很不错。当时我们在展示用XSwitch支持多模态......
X86超云服务器安装麒麟操作系统踩坑记
在项目现场用U盘安装X86架构超云服务器麒麟操作系统进行了两天才装好，就是之前的资料一个挂载方式需要从RW修改为RO一、复现步骤操作系统版本：银河麒麟高级服务器操作系统Kylin-Server-10-SP2-x86-Release-Build09-20210524.iso（x86_64）使用Rufus工具制作U盘启动盘；修改启动项，选择从U盘......
Mybatis踩坑记录:探究Mybatis源码为何当传入参数Integer类型为0时,if条件生效
目录前言编辑问题背景深入源码解决问题方案一方案二方案三结果结语前言在MyBatis中，<if>标签用于动态生成SQL查询条件。然而，在一些特定的场景下，<if>标签的条件判断可能会出现意料之外的结果。例如，当传入的Integer参数为0时，条件判断可能不会如......
【模仿学习代码复现】环境安装踩坑记录
（这人怎么又在装环境）下载了一下OpenAI的论文代码，官方readme里的依赖设置如下：*OpenAIGym>=0.1.0,mujoco_py>=0.4.0*numpy>=1.10.4,scipy>=0.17.0,theano>=0.8.2*h5py,pytables,pandas,matplotlib前面都好好的，装到theano突然发现这破玩意不支持3.6及以上版本，......
光影精灵10 Win1+Ubuntu18.04 双系统踩坑记录
前言第二年准备报名智能车了，当然还是创意组别。刚好买了今年新出的电脑光影精灵10，我想着也给它安一个双系统。但是没想到，相比于之前那个老电脑，新电脑的新硬件和驱动问题远比老电脑麻烦的多。在经历了一系列踩坑和疯狂查资料之后，加上重装系统N次，终于成功下车。遂把过程记录下来，以......

MLPerf踩坑记

MLPerf Steps

Install CM

Problem

Optimize

Submit

相关文章

赞助商

阅读排行