首页 > 系统相关 >Linux-Stream内存带宽及MLC内存延迟性能测试方法

Linux-Stream内存带宽及MLC内存延迟性能测试方法

时间:2023-09-26 09:33:55浏览次数:246  
标签:MLC Stream stream 访存 带宽 内存 测试

1、Stream内存带宽测试

  Stream是业界主流的内存带宽测试程序,测试行为相对简单可控。该程序对CPU的计算能力要求很小,对CPU内存带宽压力很大。随着处理器核心数量的增大,而内存带宽并没有随之成线性增长,因此内存带宽对提升多核心的处理能力就越发重要。Stream具有良好的空间局部性,是对TLB友好,Cache友好的一款测试程序,其分为Copy、Scale、Add和Triad四个更基本的测试功能。

Copy为最简单的操作,即从一个内存单元中读取一个数,并复制到另一个内存单元,有2次访存操作。
Scale是乘法操作,从一个内存单元中读取一个数,与常数scale相乘,得到的结果写入另一个内存单元,有2次访存。
Add是加法操作,从两个内存单元中分别读取两个数,将其进行加法操作,得到的结果写入另一个内存单元中,有2次读和1次写共3次访存。
Triad是前面三种的结合,先从内存中读取一个数,与scale相乘得到一个乘积,然后从另一个内存单元中读取一个数与之前的乘积相加,得到的结果再写入内存。所以,有2次读和1次写共3次访存操作。

  从上述的结果我们可以看出,测试的内存带宽Add>Triad>Copy>Scale。这是因为访存次数越多,内隐藏的访存延迟越大,得到的带宽越大。同理,运算的操作越复杂,操作时间就越长,程序运行时间就越长,得到的访存带宽就相应减少。这就是为什么3次访存的操作得到的带宽比2次访存操作得到的要大,而相同访存次数的操作,加法要比乘法得到的结果要好。

2、MLC内存延迟测试

  影响应用程序性能的一个关键因素是应用程序从处理器缓存和从内存子系统获取数据所消耗的时间,(Intel Memory Latency Checker(Intel MLC) 是一个用于测试延迟和带宽随着系统负载增加而变化的工具; 支持 Linux 、Windows;实现方法是: MLC 创建压测主机逻辑处理器数量减 1 个线程,然后使用这些线程生成压测流量,余下的 1 个 vCPU 用于运行一个测量延迟的线程。

类型

预期结果

测试步骤

stream内存带宽测试

Best Rate数值越高越好

1、安装gcc下载http://www.cs.virginia.edu/stream/FTP/Code/stream.c
2、编写测试脚本stream_test.sh
3、执行脚本
#!/bin/bash
#获取可用memory
available_memory_size=$(free -m | grep Mem | awk  ' { print ($4)*1024*1024 } ' )
#计算最大array_size
array_size=$((available_memory_size/8/6))
#编译stream
gcc -O stream.c -fopenmp -DSTREAM_ARRAY_SIZE=$array_size -DNTIME=30 -mcmodel=medium -o stream.o
#执行测试
./stream.o

MLC内存延迟测试

ns的值越低越好

1、下载wget https://downloadmirror.intel.com/736634/mlc_v3.9a.tgz 并解压tar -zxvf mlc_v3.9.tgz
2、执行命令 ./Linux/mlc --idle_latency -e -r -l128 -D8192

 

标签:MLC,Stream,stream,访存,带宽,内存,测试
From: https://www.cnblogs.com/zwh-Seeking/p/17729385.html

相关文章

  • 查看docker容器使用的cpu和内存
    转载请注明出处:使用dockerps命令列出正在运行的Docker容器,并获取目标容器的ID或名称。使用dockerstats<容器ID或名称>命令来实时监测指定容器的资源使用情况。该命令将显示容器的CPU利用率、内存使用量、网络流量等信息。例如,要查看名为my_container的容器的资源使用情......
  • Qt 5——对象树及对象树容易出现的内存问题
    对象模型(对象树) 在Qt中创建对象的时候会提供一个Parent对象指针,下面来解释这个parent到底是干什么的。QObject是以对象树的形式组织起来的。当你创建一个QObject对象时,会看到QObject的构造函数接收一个QObject指针作为参数,这个参数就是parent,也就是父对象指针。这相当于,在......
  • idea设置项目启动的JVM运行内存大小
    idea设置项目启动的JVM运行内存大小场景在开发当中,idea默认服务启动要占用1G内存。其实每个项目本地开发和调试的时候,根本不需要1G内存,200M左右足以如果在微服务体系下,那效果更明显,相同的内存可以启动更多的服务刚好本人的电脑只有8G,公司的微服务项目启动后,电脑风扇疯狂的转动。解......
  • 【C++】动态内存管理 ⑤ ( 基础数据类型数组 内存分析 | 类对象 内存分析 | malloc 分
    文章目录一、基础数据类型数组内存分析1、malloc分配内存delete释放内存2、new分配内存free释放内存二、类对象内存分析1、malloc分配内存delete释放内存2、new分配内存free释放内存博客总结:C语言中使用malloc分配的内存,使用free进行释放;C++语言中......
  • Java内存模型
    JavaMemoryModel,JMM是一种规范,定义了程序中各个变量的访问规则,以及在某个线程中对这些变量进行访问时需要遵守的同步策略,所以其目的是解决多线程正确执行的问题。Java内存模型确保了多线程程序的可见性、有序性和原子性;主要内容包括:主内存(MainMemory):所有变量都存储在主内......
  • #define 定义的明示变量就是在预处理阶段用标识符后面的值替换标识符,因此不会占据内存
    1.常考:预处理阶段只进行文本替换,不进行运算对于最后一条,预处理指令定义的标识符都不会占据内存。预处理指令也称预编译指令,即在编译之前进行一些处理,而预处理做的其实就是文本替换,这个过程也叫做宏展开,即用宏定义后面的替换体将程序中出现宏的地方替换掉。例如,#define定义的明示......
  • Java内存模型——基础
    JMM因何产生由于计算机的存储设备与处理器的运算能力之间有几个数量级的差距,所以现代计算机系统都不得不加入一层读写速度尽可能接近处理器运算速度的高速缓存(Cache)来作为内存与处理器之间的缓冲——将运算需要使用到的数据复制到缓存中,让运算能快速进行,当运算结束后再从缓存同步回......
  • 全局数组未加锁访问溢出导致才内存
    在客户那里发现有些数据包被错误的转到了standbySMM上,后面查看proc发现是knet.ko中的role字段被踩后面再检查发现有三个字段都被踩:zyc@fishsmm_arm64(/≧▽≦)/~/do_not_remove/aarch64-marvell-linux-gnu-nmlinux-casa-knet.ko|grepsmm_role0000000006925110B......
  • Stream流
    Stream流中间方法publicclassDemo01{publicstaticvoidmain(String[]args){Students1=newStudent("蜘蛛精",26,172.5);Students2=newStudent("蜘蛛精",26,172.5);Students3=newStudent("紫霞",23,......
  • 【C语言菜鸟知识】——动态内存管理
    --------------------------------------------------------------------------------------------------------------------- 1、栈在全局变量是分配在内存中的静态储存区,非静态的局部变量是分配在内存中的动态储存区,这个储存区就是栈的区域。2、堆在内存中允许建立内存动态分......