首页 > 其他分享 >深圳大学-计算机系统(3)-实验一MIPS指令集实验

深圳大学-计算机系统(3)-实验一MIPS指令集实验

时间:2025-01-21 13:57:34浏览次数:3  
标签:ld 窗口 WinMIPS64 点击 指令 实验 r0 深圳大学 MIPS

实验目标

a) 了解WinMIPS64的基本功能和作用;
b) 熟悉MIPS指令、初步建立指令流水执行的感性认识;
c) 掌握该工具的基本命令和操作,为流水线实验作准备。

实验内容

按照下面的实验步骤及说明,完成相关操作记录实验过程的截图:
1)下载WinMIPS64;运行样例代码并观察软件各个观察窗口的内容和作用,掌握软件的使用方法。(80分)
2)学会正确使用WinMIPS64的IO方法;(10分)
3)编写完整的排序程序;(10分)

实验环境

硬件:桌面PC
软件:Windows,WinMIPS64仿真器

实验步骤及说明

WinMIPS64是一款指令集模拟器,它是基于WinDLX设计的,如果你对于WinDLX这款软件十分熟悉的话,那么对于WinMIPS64也会十分的容易上手。DLX 处理器 (发音为 “DeLuXe”)是Hennessy 和Patterson合著一书《Computer Architecture - A Quantitative Approach》中流水线处理器的例子。WinDLX是一个基于Windows的模拟器。
本教程通过一个实例介绍WinMIPS64的使用方法。WinMIPS64模拟器能够演示MIPS64流水线是如何工作的。
本教程使用的例子非常简单,它并没有囊括WinMIPS64的各个方面,仅仅作为使用WinMIPS64的入门级介绍。如果你想自己了解更多的资料,在给出的winmips64.zip中,有WinMIPS64 — Documentation Summary.html和winmipstut.docx两个文件可以供你随时参考,其中涵盖了WinMIPS64的指令集和模拟器的组成与使用方法。
虽然我们将详细讨论例子中的各个阶段,但你应具备基本的使用Windows的知识。现假定你知道如何启动 Windows,使用滚动条滚动,双击执行以及激活窗口。

(一)、安 装
在Windows下安装WinMIPS64 :
解压给出的winmips64.zip压缩文件到我的电脑上D盘的D:\software\winmips64 
在这里插入图片描述
(二)、一个完整的例子

1.开始和配置WinMIPS64
在winmips64这个子目录下,双击winmips64.exe文件,即打开了WinMIPS64模拟器,其外观如下图:
在这里插入图片描述
为了初始化模拟器, 点击File 菜单中的 Reset all(Ctrl+R) 菜单项即可。
WinMIPS64可以在多种配置下工作。你可以改变流水线的结构和时间要求、存储器大小和其他几个控制模拟的参数。点击 Configuration / Floating Point Stages(点击Configuration打开菜单,然后点击Architecture菜单项),选择如下标准配置:
在这里插入图片描述
如果需要,可以通过点击相应区域来改变设置。然后,点击OK 返回主窗口。
在 Configuration 菜单中的其他四个配置也可以设置,它们是:Multi-Step, Enable Forwarding, Enable Branch Target Buffer 和 Enable Delay Slot。 点击相应菜单项后, 在它的旁边将显示一个小钩。如下图所示(下图仅做功能示范,实验时并没有勾选“Enable Forwarding”):
在这里插入图片描述
本次实验要求不要勾选“Enable Forwarding”。
2. 装载测试程序
用标准的text编辑器来新建一个名为sum.s的文件,这个文件的功能是,计算两个整数A、B之和,然后将结果传给C。程序如下:

.data
A:	.word 10
B:	.word 8
C:	.word 0

.text
main:
ld r4,A(r0)
ld r5,B(r0)
dadd r3,r4,r5
sd r3,C(r0)
halt

在将该程序装载进WinMIPS64之前,我们必须用asm.exe来检验该输入程序的语法正确性。asm.exe程序文件在所给的winmips压缩包里有,用命令行使用它。具体操作为,打开终端,利用cd命令进到D:\software\WinMIPS64目录中,然后直接使用asm.exe sum.s命令,检查输出结果是否无误。输出结果如下,可知代码无误。
在这里插入图片描述
在开始模拟之前,至少应装入一个程序到主存。为此,选择File / OPEN,窗口中会列出当前目录中所有汇编程序,包括sum.s。
按如下步骤操作,可将这个文件装入主存。

  • 点击 sum.s
  • 点击 open 按钮
    在这里插入图片描述
    现在,文件就已被装入到存储器中了,现在可以开始模拟工作了。
    你可以在CODE窗口观察代码内容,可以在DATA窗口观察程序数据了。
    CODE窗口如下:
    在这里插入图片描述
    DATA窗口如下:
    在这里插入图片描述
    3.模 拟
    在主窗口中,我们可以看见七个子窗口,和一条在底部的状态栏。这七个子窗口分别是Pipeline, Code, Data, Registers, Statistics, Cycles和Terminal。在模拟过程中将介绍每一个窗口的特性和用法。
    (1) Pipeline 窗口
    在Pipeline窗口中,展示了MIPS64处理器的内部结构,其中包括了MIPS64的五级流水线和浮点操作(加法/减法,乘法和除法)的单元。展示了处于不同流水段的指令。
    在这里插入图片描述
    (2) Code 窗口
    我们来看一下 Code 窗口。你将看到代表存储器内容的三栏信息,从左到右依次为:地址 (符号或数字)、命令的十六进制机器代码和汇编命令。
    我们可以看到,初始时,第一行为黄色,表示该行指令处于“取指”阶段。
    现在,点击主窗口中的 Execution开始模拟。在出现的下拉式菜单中,点击Single Cycle或按 F7键。
    这时,第一行变成了了蓝色,第二行变成了黄色,这表示第一行指令处于“译码”阶段,而第二行指令处于“取指”阶段。这些不同的颜色代表指令分别处于不同的流水线阶段。黄色代表“取指”,蓝色代表“译码”,红色代表“执行”,绿色代表“内存数据读或写”,紫色代表“写回”。
    接着按F7,直到第五个时钟周期的时候,有趣的事情发生了,“dadd r3,r4,r5”指令没有从“译码”跳到其下一个流水阶段“执行”,并且“sd r3,C(r0)”指令,仍然停留在“取指”阶段,同时在terminal窗口显示一行信息“RAW Stall in ID (RS)”,思考一下这是为什么?
    在这里插入图片描述
    (3) Cycls窗口
    我们将注意力放到Cycls窗口上。它显示流水线的时空图。
    在这里插入图片描述
    在窗口中,你将看到模拟正在第五时钟周期,第一条指令正在WB段,第二条命令在MeM段,第四条命令在处于暂停状态(installed),第五条指令也因此停滞不前。这是因为发生了数据相关(第四条指令的dadd命令需要用到寄存器r5的值,但是r5的值并不可用)。
    接着点击F7,到第五个时钟周期时,再次发生相关,造成停滞。接着点击F7,直至第十三个时钟周期全部指令执行结束。
    值得一提的是,Cycls窗口是分为两个子窗口的,左边的子窗口是一系列的指令,右边的窗口是图示的指令执行过程。其中,左边子窗口的命令是动态出现的,当一条指令在进行“取指”时,该指令才出现,而且,当出现了数据相关的时候,所涉及到的指令会变色,暂停的指令会变成蓝色,而被其影响的后续指令会变成灰色。
    (4) Data 窗口
    在Data中,我们可以观察到内存中的数据,包括数据内容和地址两个方面,其中地址使用64位表示。
    如果想改变一个整型的数据的值,左键双击该值所在的行,如果是想改变一个浮点类型的数据的值,那么请右键双击该值所在的行。
    在这里插入图片描述
    上图即为第十三个时钟周期的data窗口的图示,其中,左边一行即为用64位表示的内存地址,中间行为数据的内容,右边的一行为相关的代码。可以看出,在这个时钟周期,A与B的值分别为0xa和0x8,C的值为0x12,表明A与B的值之和已经相加并保存到了C中。
    (5) Registers 窗口
    这个窗口显示存储在寄存器中的值。
    如果该寄存器为灰色,那么它正处于被一条指令写入的过程,如果它用一种颜色表示,那么就代表,该颜色所代表的的流水线阶段的值可以用来进行前递(forwarding)。同时,这个窗口允许你交互式的该变寄存器的值,但是前提是该寄存器不能处于被写入或者前递的阶段。如果想改变一个整型的数据的值,左键双击该值所在的行,如果是想改变一个浮点类型的数据的值,那么请右键双击该值所在的行,然后按OK来进行确定。
    在这里插入图片描述
    上图即为第十三个时钟周期的Registers窗口的图示,很显然,其中可以很清楚的看出每个寄存器的值是什么。
    (6) Statistics 窗口
    最后我们来看一下Statistics 窗口。
    这个窗口是用来记录一些模拟周期的统计数据。其中包括Execution,Stalls,和Code Size三个大项。其中,Execution用来显示模拟周期中指令数,执行周期数和CPI(没条指令所用周期数),Stalls用来表示暂停的周期数,并且分门别类的进行了统计,其中包括RAW Stalls,WAW Stalls,WAR Stalls, Structural Stalls, Branch Taken Stalls和Branch misprediction Stalls。Code Size表示了代码的大小,用byte表示。
    在这里插入图片描述
    上图即为Statistics窗口的图示,其中表示了该程序有13个时钟周期,5条指令,CPI
    为2.600,有4个RAW Stalls,代码大小为20个Bytes。
    (三)、更多操作
    首先,点击File/Reset MIPS64(ctrl + R)进行重置。如果你点击File/Full Reset,你将删除内存中的数据,这样你就不得不重新装载文件,所以点击File/Reload(F10)是一个很方便的重置的方法。
    你可以一次推进多个时钟周期,方法是点击Execute/Multi cycle(F8),而多个时钟周期数是在Configure/Multi-step中设置的。
    你也可以通过按F4一次完成整个程序的模拟。同时,你可以设置断点,方法是,在Code窗口中左键双击想要设置断点的指令,该指令会变成蓝色,然后点击F4,程序就会停在这条指令执行“ 取指”的阶段,如果想要清除断点,再次左键双击改行指令。
    (四)、终端I/O的简单实例
    通过上面对WinMIPS64的了解,我们可以开始简单的使用该工具了。
    这里,需要我们编写一个简单的终端输出“Hello World!!”的小程序,运行并且截图。所以,我们需要了解如何将数据在终端中输出输入。
    下图是I/O区域的内存映射,一个是控制字,一个是数据字:
    在这里插入图片描述
    所以我们需要先将CONTROL和DATA地址读取到寄存器,然后分别在这两个区域内存储相应的序列号(如上图所示)和要显示在Terminal窗口的数据,同时,设置CONTROL为9,我们能对其进行读取数据。
    请编写完整程序,输出“Hello World!”字符串。helloworld.s文件如下:
    在这里插入图片描述
    然后通过asm.exe来检验该程序的语法正确性
    在这里插入图片描述
    然后在WinMIPS64中的File栏中open打开文件。最后一步步按F7,同时观察各个窗口。最终还要截取Terminal窗口,图如下:
    在这里插入图片描述
    证明你的程序结果输出了“Hello World!”。
    (五)、编写排序算法
    在这一部分,我们要求编写一个排序算法,对一组int型数据进行排序。该算法使用冒泡排序法,并且在其中嵌入一个swap函数过程(该算法在课本上有完整的程序,但是其中的数据初始化、寄存器映射、命令的映射以及I/O部分还需要自己手动编写)。编写完成后,在asm.exe中进行检测,然后运行。
    初始数据要求为:“array: .word 8,6,3,7,1,0,9,4,5,2”
    该程序需要对0到10,十个数进行了排序,其中使用了sort和swap两个函数过程,并且swap是嵌套在sort中的,在编写程序的时候一定要注意使用栈来保留寄存器的值,嵌套时还额外需要保存$ra的值。代码如下:
    首先是数据字段和主函数,主函数里头,打印排序前的数组,然后调用冒泡排序,然后打印排序后的数组。
    在这里插入图片描述
    在这里插入图片描述
    以下代码为冒泡函数,用于排序一个数组,参数为数组和数组长度。
    在这里插入图片描述
    在这里插入图片描述
    以下是swap函数,用于交换两个数。
    在这里插入图片描述
    然后通过asm.exe来检验该程序的语法正确性:
    在这里插入图片描述
    在这里插入图片描述
    (六)、结束语
    本实验通过一个例子介绍了WinMIPS64的重要特性,使你对流水线和MIPS64的操作类型有了一定的了解。当然,你还必须学习更多的知识,才能更深入地了解WinMIPS64。请参阅在winmips.zip压缩文件中的相关资料。

实验总结与体会

  1. 通过本次实验,我学会了WinMIPS64的基本操作,例如如何载入程序、运行程序等。
  2. 通过本次实验,我还对流水线有了基本的认识,每个指令就像传送带的货物一样,五个节拍就像是处理货物的机器一般,每个货物在传送带一直往前,指令不断地进行每个节拍,如果有一个节拍暂时无法进行,那么将会等待直到可以执行为止,此时后面的指令都会被阻塞。
  3. 通过本次实验,我也认识到了流水线的优点:
    ①允许同时执行多条指令的不同阶段,从而提高了处理器的吞吐量和效率
    ②多条指令可以同时处于不同阶段,整体的指令执行时间会缩短。
  4. 通过编写冒泡排序程序,我有效地应用了所学到的MIPS指令集知识,巩固了我的编程能力。

实验代码

.data
arr: .word 61, 11, 65, 47, 9, 74, 79, 70, 91, 91, 97, 10, 65, 10, 3, 6, 20, 75, 29, 12, 95, 71, 85, 24, 42, 59, 55, 50, 23, 81, 64, 14, 9, 56, 15, 78, 96, 35, 57, 6
before: .asciiz "before sort the array is:\n"
after: .asciiz "after sort the array is:\n"
CONTROL: .word 0x10000
DATA: .word 0x10008
SP: .word 0x300  # 堆栈指针

.text
main:
    ld r16, CONTROL(r0)  
    ld r17, DATA(r0) 
    # 打印提示信息 "Before sort the array is:\n"
    daddi r8, r0, 4  
    daddi r9, r0, before  
    sd r9, (r17)  
    sd r8, (r16)  

    # 打印数组
    daddi r8, r0, 2  
    daddi r2, r0, 40  
    daddi r1, r0, 0  
print1:
	# 打印 arr[i]
    dsll r3, r1, 3  
    ld r9, arr(r3) 
    sd r9, (r17) 
    sd r8, (r16)  
    
    daddi r1, r1, 1     # i++
    bne r1, r2, print1  # 循环未结束,继续打印

    # 调用冒泡排序
    ld r29, SP(r0)     # r29 <- M[SP], 用于维护堆栈指针
    daddi r4, r0, arr  # 参数1: a[]
    daddi r5, r0, 40   # 参数2: n
    jal bubbleSort     # 跳转到bubbleSort函数

    # 打印提示信息 "After sort the array is:\n"
    daddi r8, r0, 4  
    daddi r9, r0, after  
    sd r9, (r17)  
    sd r8, (r16)  

    # 打印数组
    daddi r8, r0, 2  
    daddi r2, r0, 40  
    daddi r1, r0, 0  
print2:
    # 打印 arr[i]
    dsll r3, r1, 3  
    ld r9, arr(r3)  
    sd r9, (r17)  
    sd r8, (r16)
    
    daddi r1, r1, 1     # i++
    bne r1, r2, print2  # 循环未结束,继续打印
    halt

# 冒泡排序
bubbleSort:
    # 分配栈帧,保存返回地址和寄存器数据
    daddi r29, r29, -24  
    sd $ra, 16(r29)  
    sd r16, 8(r29)  
    sd r17, 0(r29)  

    dadd r22, r4, r0  # r22 = a[]
    daddi r23, r5, 0  # r23 = n

    daddi r18, r0, 0  # r18 = i = 0
loop1:
    # for (int i = 0; i < n - 1; i++)
    daddi r10, r23, -1  # r10 = n - 1
    slt r11, r18, r10   # 当r18 < r10,r11 = 1
    beq r11, r0, end1   # 如果i >= n - 1,跳转到 end1

    daddi r19, r0, 0    # r19 = j = 0
    daddi r20, r23, -1  # r20 = n - 1
    dsub r20, r20, r18  # r20 = n - 1 - i
loop2:
    # for (int j = 0; j < n - 1 - i; j++)
    slt r11, r19, r20  # 当r19 < r20,r11 = 1 
    beq r11, r0, end2  # 如果j >= n - 1 - i,跳转到 end2
    
    dsll r12, r19, 3    # r12 = j * 8
    dadd r13, r22, r12  # r13 = a + j * 8
    ld r14, 0(r13)      # r14 = M[r13] = a[j]
    ld r15, 8(r13)      # r15 = M[r13 + 8] = a[j + 1]

    # if (a[j] > a[j + 1]) swap(a[j], a[j + 1]);
    slt r11, r15, r14     # 当r15 < r14,r11 = 1
    beq r11, r0, no_swap  # 如果不交换,跳转到 no_swap

    # 交换 a[j] 和 a[j + 1]
    dadd r4, r0, r13  # 参数1: a + j * 8        a[j]
    daddi r5, r13, 8  # 参数2: a + (j + 1) * 8  a[j + 1]
	jal swap         

no_swap:
    daddi r19, r19, 1  # j++ 
    j loop2            # 循环到 loop2

end2:
    daddi r18, r18, 1  # i++
    j loop1            # 循环到 loop1

end1:
    # 恢复寄存器数据和堆栈帧
    ld r17, 0(r29)  
    ld r16, 8(r29)
    ld $ra, 16(r29) 
    daddi r29, r29, 24  
    jr $ra 

swap:  
    # 交换 a[i] 和 a[j]
    ld r9, 0(r4)   # r9 = a[i]
    ld r10, 0(r5)  # r10 = a[j]
    sd r10, 0(r4)  # a[i] = r10
    sd r9, 0(r5)   # a[j] = r9
    jr $ra         # 返回到M[PC]
 

标签:ld,窗口,WinMIPS64,点击,指令,实验,r0,深圳大学,MIPS
From: https://blog.csdn.net/qq_73179413/article/details/145281672

相关文章

  • 如何高效整合海量仪器数据?电子实验记录本给出答案
    实验记录是科研人员对实验过程与结果的忠实记录,维系着科研工作的严谨性与连贯性。各类仪器产生的实验数据量呈爆发式增长,其记录主要存在两大类模式,即传统的纸质模式和现代的电子化模式。一,纸质实验记录模式效率低纸质记录模式面对海量数据,其不利之处如下:1,手抄,速度太慢......
  • 华为HCIE-BigData认证学习资料分享(考试大纲、培训教材、实验手册等等)
    大家好,作为一名大数据技术爱好者,我最近完成了华为HCIE-BigData认证考试,今天想和大家分享一下我的备考经验、考试过程中的挑战以及如何高效规划备考时间,希望对正在备考的小伙伴们有所帮助。 【点赞+关注】私我领取华为大数据认证考试复习资料/题库一、华为HCIE-BigData认证......
  • AdaBoost算法原理与实验分析
    AdaBoost算法原理与实验分析1.引言AdaBoost(AdaptiveBoosting,自适应增强)是一种重要的集成学习算法。它的核心思想是通过迭代训练一系列弱分类器(比如简单的决策树),并将它们组合成一个强分类器。AdaBoost的特别之处在于它能够自适应地调整样本的权重,重点关注那些难以分类的......
  • XGBoost分类算法原理与实验分析
    XGBoost分类算法原理与实验分析1.引言XGBoost(eXtremeGradientBoosting,极限梯度提升)是一种高效的梯度提升树算法。它通过优化正则化目标函数,集成多个CART树(分类与回归树)来构建强大的分类器或回归模型。XGBoost在传统梯度提升树(GBDT)的基础上进行了改进,加入了正则化项以防......
  • ESP32 学习笔记(九)舵机实验
    概念舵机是一种位置(角度)伺服的驱动器,适用于那些需要角度不断变化并可以保持的控制系统。舵机只是一种通俗的叫法,其本质是一个伺服电机。舵机有很多规格,但所有的舵机都有外接三根线,分别用棕、红、橙三种颜色进行区分,由于舵机品牌不同,颜色也会有所差异,棕色为接地线,红色为电源正极......
  • 个人华为数通考试经验分享(全套华为数通认证资料:考试大纲、培训教材、实验手册等等)
    备考经验1.X园区部分:在备考的初期,我首先是通过听课和做笔记来掌握基础知识点。重点是要熟悉业务地址、配置步骤和相关信息。特别提醒,不建议照着视频解题,要真正理解每个配置背后的原理和逻辑。★建议:前期:听课并做笔记,确保基础扎实。后期:加快解题速度,可以通过复制配置步骤......
  • (pta)实验3-7-switch/for 统计学生成绩
    作者 陈建海单位 浙江大学本题要求编写程序读入N个学生的百分制成绩,统计五分制成绩的分布。百分制成绩到五分制成绩的转换规则:大于等于90分为A;小于90且大于等于80为B;小于80且大于等于70为C;小于70且大于等于60为D;小于60为E。输入格式:输入在第一行中给出一个正整数N(≤100......
  • 随机森林分类算法原理与实验分析
    随机森林分类算法原理与实验分析1.引言随机森林(RandomForest)是一种集成学习方法,它通过构建多个决策树并结合它们的预测结果来进行分类。你可以把它想象成一个“团队决策”的过程:团队中的每个成员(决策树)都独立发表意见,最后通过投票决定最终结果。这种方法不仅提高了模型......
  • 多变量决策树原理与实验分析
    多变量决策树原理与实验分析1.引言决策树是机器学习中最基础也最重要的算法之一。你可以把它想象成一个不断做选择题的机器。比如,我们要判断一个水果是苹果还是橙子,传统决策树会问:“它的颜色是红色吗?”如果是,就判断为苹果;如果不是,再问:“它的形状是圆形吗?”通过一系列这样......
  • 数据搬运工DMA原理与实验
    STM32数据搬运工-DMASTM32-DMA工作原理DMA的概念:DMA,全称为:DirectMemoryAccess,即直接存储器访问。DMA传输方式无需CPU直接控制传输,也没有中断处理方式那样保留现场和恢复现场的过程,通过硬件为RAM与I/O设备开辟一条直接传送数据的通路,能使CPU的效率大为提高。......