首页 > 其他分享 >计算机系统性能评价与性能分析

计算机系统性能评价与性能分析

时间:2023-03-20 20:34:36浏览次数:54  
标签:计算机系统 越大越 性能 CPU 指令 评价 每秒 时钟

参考:https://foxsen.github.io/archbase/%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%B3%BB%E7%BB%9F%E6%80%A7%E8%83%BD%E8%AF%84%E4%BB%B7%E4%B8%8E%E6%80%A7%E8%83%BD%E5%88%86%E6%9E%90.html#%E6%B5%8B%E8%AF%95%E7%A8%8B%E5%BA%8F%E9%9B%86

 

完成一个任务所需要的时间可以由完成该任务需要的指令数、完成每条指令需要的拍数以及每拍需要的时间三个量相乘得到。

 

因此人们通过一系列基准程序集来评价计算机性能,包括SPEC CPU、SPECweb、SPECjbb、STREAM、LMbench、Linpack、SPLASH、EEMBC等等。

 

性能分析可以分为性能建模和性能测量两类。性能建模主要用于设计的早期还没有实际系统阶段,又可以细分为基于模拟的建模和基于分析的建模。在原型系统出来之后,实际机器的测量提供了一个附加的反馈可以帮助验证设计阶段的分析模型。最后,对一些具体计算机系统进行性能比较和分析。

 

12.1 计算机系统性能评价指标

 

我们经常说一台机器速度很快,这个“快”怎么衡量?对于普通用户而言,速度快就是执行一个程序运行的时间短。对于Web服务器而言,性能高表示每秒所完成应答的Web请求数量大,对于像京东和淘宝这样的电子商务网站,衡量的指标通常是每秒完成的交易事务(Transaction)即吞吐率。

 

 

12.1.1 计算机系统常用性能评价指标

 

计算机系统的性能有许多衡量指标,如 每条指令的时钟周期数(CPI)、每秒执行百万条指令数(MIPS)、每秒执行百万浮点运算数(MFLOPS)

 

Openbenchmarking.org网站收集了大量的开源测试程序集合,这个测试程序集合称为Phoronix Test Suite。

12.1给出了AMD Athlon II X4 645的测试结果。

从表中可以看出性能衡量指标包括以下方面:

完成任务的执行时间,例如并行的BZIP2压缩和LAME MP3编码,执行时间越短越好。

每秒多少帧,每秒的帧数是越多越好,例如H.264视频编码和射击游戏《帕德曼的世界》(World of Padman)。

MIPS,例如7-ZIP测试压缩速度。

MFLOPS,如Himeno中泊松压力方程求解。

每秒执行了多少个事务,如PostgreSQL pgbench测试TPC-B。

每秒传递多少个签名,如OpenSSL中RSA测试。

每秒服务多少个请求,如Apache网页服务器。)

每秒执行的百万次操作数(Mop/s),如NPB中的EP.B。

每秒完成计算多少个节点,如TSCP人工智能下棋程序,每秒能下多少步棋。

带宽,即每秒能完成多少MB的访存操作,如STREAM测试程序。

 

 

表 12.1: AMD Athlon处理器的Phoronix Test Suites测试结果

 

测试程序

指标

性能

分值

World of Padman v1.2

每秒帧数(FPS)

越大越好

177.33

H.264 v2015-11-02

每秒帧数(FPS)

越大越好

101.97

GraphicsMagic v1.3.12
HWB Color Space

每分钟迭代次数

越大越好

108.00

John The Ripper v1.7.9
Traditional DES

每秒破解的数目

越大越好

5,174,833.00

John The Ripper v1.7.9
Blowfish

每秒破解的数目

越大越好

1,970.00

TTSIOD 3D Renderer v2.2w

每秒帧数(FPS)

越大越好

39.01

Parallel BZIP2 Compression v1.0.5

秒数

越小越好

27.98

7-ZIP Compression v9.20.1
Compress Speed Test

MIPS

越大越好

7,242.00

LAME MP3 Encoding v3.99.3
WAV to MP#

秒数

越小越好

22.86

x264 v2011-12-06
H.264 Video Encoding

每秒帧数(FPS)

越大越好

54.04

FFmpeg v0.10
AVI to NTSC VCD

秒数

越小越好

17.57

OpenSSL v1.0.0e
RSA 4096-bit

每秒签名数

越大越好

58.58

Himeno Benchmark v3.0
Poisson pressure solver

MFLOPS

越大越好

516.47

PostgreSQL pgbench v8.4.11
TPC-B transaction per second

TPS

越大越好

427.13

Apache benchmark v2.2.21
Static web page serving

每秒请求数

越大越好

11,784.34

C-Ray v1.1

秒数

越小越好

120.23

POV-Ray v3.6.1

秒数

越小越好

1,129.00

Smallpt v1.0
Global Illumnination Renderer

秒数

越小越好

241.00

TSCP v1.81
AI Chess performance

每秒计算的节点数

越大越好

261,528.00

NAS Parallel benchmarks v3.3
EP.B

总的Mop/s

越大越好

70.06

STREAM v2009-04-11
Copy

MB/s

越大越好

6,381.28

归根到底,计算机的性能最本质的定义是“完成一个任务所需要的时间”。计算机系统完成某个任务所花费的时间,我们称为执行时间。

 

在比较两台机器(X和Y)的性能时,X的速度是Y的n倍是指Y的执行时间是X的执行时间的n倍。

 

历史上很长一段时间,测量计算机的速度通过时钟频率(MHz或GHz)来描述,这表示CPU时钟的每秒时钟周期数。

 

2000年时主频基本就是速度的标志,主频越高的芯片卖得价格也越高。然而这种方法会有一定的误导,因为一个有很高时钟频率的机器,不一定有很高的性能,其他影响速度的因素还包括功能单元的数量、总线的速度、内存的容量、程序动态执行时指令的类型和重排序特性等。因此,厂商已经不再把时钟频率当作测量性能的唯一指标。

 

对于处理器的性能评价,有相应的处理器性能公式。一个程序的CPU时间可以描述为:

 

CPU时间=程序的CPU时钟周期数×时钟周期

CPU时间=程序的CPU时钟周期数/时钟频率

 

得到时钟周期数和指令数后,就可以计算出每条指令的时钟周期数(Clock cycles Per Instruction,简称CPI),即平均每条指令执行需要花费多少个时钟周期。在衡量相同指令集处理器的设计时,CPI是一个非常有效的比较方法。

 

有时设计者也使用CPI的倒数,即每个时钟周期内所执行的指令数(Instructions Per Clock,简称IPC)。现代处理器微体系结构的性能特性通常采用IPC或CPI来描述,这种测量方法和处理器的时钟频率没有关系。

 

标签:计算机系统,越大越,性能,CPU,指令,评价,每秒,时钟
From: https://www.cnblogs.com/yinhuachen/p/17237629.html

相关文章

  • mysql索引、优化、sql性能分析
    为什么InnoDB存储引擎选择使用B+tree索引结构?相对于二叉树,层级更少,搜索效率高对于B-tree,无论是叶子节点还是非叶子节点,都会保存数据,这样导致一页中存储的键值减少,指针......
  • 性能测试
    一、性能测试的学习目的:1、所有公司的项目都要进行性能测试,不管是蒙混过关、还是性能压力需求少2、测试工程师要完成企业的性能测试3、多用户并发、负载等......
  • 性能测试基本知识
    一、软件项目中性能测试的概念: 性能测试是指通过特定方式,对被测系统按照一定策略事假压力,获取系统响应时间、TPS(TransactionPerSencond)、吞吐量、资源利用率等性能指标,......
  • 记录--两行CSS让页面提升了近7倍渲染性能
    这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助前言对于前端人员来讲,最令人头疼的应该就是页面性能了,当用户在访问一个页面时,总是希望它能够快速呈现在......
  • 全链路压测(13):高可用和性能优化
    转载:https://www.cnblogs.com/imyalost/p/16295324.html大家好,这是全链路压测系列的第十三篇文章,也是倒数第二篇文章。前面用了很多篇幅介绍了包括全链路压测的调研验证......
  • 性能分析优化的道与术
    转载:https://www.cnblogs.com/imyalost/p/16156795.html之前有很多同学问我,性能测试中到底该如何去定位分析瓶颈并进行性能优化?感觉压测场景设计做的很全面,分析工具也用了......
  • Redxu(RTK) 基础 性能与数据范式化 6.3 提升渲染性能
    调研渲染行为(使用profiler观察组件的渲染情况)这里使用到了reduxprofiler这个调试工具(当然得提前安装好Reactdevtools这个chrome),以我们已经编写好的页面举例子:Pr......
  • 《深入理解计算机系统》第四章学习笔记 处理器体系结构
    一个处理器支持的指令和指令的字节级编码称为它的指令集体系结构。不同的处理器“家族”,例如IntelIA32和x86-64、IBM/FreescalePower和ARM处理器家族,都有不同的ISA。一个......
  • 【性能优化方法论系列】一、性能优化的本质
    1性能优化的根本目的是什么?可能很多人没有认真思考过:“为什么我们需要进行性能优化?”这个问题。在我看来,性能优化是为了“解决良好的用户体验和资源的有限性之间的矛盾”。......
  • 【性能测试】性能监控命令(MEMORY | IO and NETWORK | CPU)
    一、性能监控命令|MEMORYMEMORY首先说说虚拟内存和物理内存:虚拟内存就是采用硬盘来对物理内存进行扩展,将暂时不用的内存页写到硬盘上而腾出更多的物理内存让有需要的......