- 参考
- 《计算机组成与设计 第五版》
- 《RISC-V-Reader-Chinese-v2p1》(包云岗老师)
- 《手把手教你设计CPU RISC-V处理器》
- https://blog.csdn.net/qq_38915354/article/details/115696721
- https://zhuanlan.zhihu.com/p/374235855
1. 寄存器相关
- RISC-V 架构可选32bit(RV32)/64bit(RV64),可选32个寄存器(I架构)/16个寄存器(E架构)。
- 考虑整数通用寄存器组:其中0寄存器被预留为常数0,其余31/15个寄存器为通用整数寄存器。
- 考虑浮点寄存器组(一般为F/D类扩展指令集),有32个通用浮点寄存器;寄存器位宽由扩展指令集类型决定,F类:单精度、32bit,D类:双精度、64bit。
- RISC-V 的汇编语言是对寄存器的数据进行处理。
- 算术运算(加、减、立即数加)。
- 数据传输(取:从存储器取数据到寄存器;存:从寄存器读数据存到存储器,更多关于存储器访问指令下面有介绍)。
- 逻辑运算(与,或,异或...)。
- 移位操作(逻辑左/右移,算数左/右移)。
- 条件分支(相等、不等、大于、小于跳转)。
- 无条件跳转(跳转 - 链接)。
- 存储器访问指令
- 对于更复杂的数据结构(例如数组和结构体)包含比寄存器更多的数据元素,只能存放于存储器中,使用数据传输指令进行读取。
- 与RISC架构策略一致,只有Load和Store指令可以访问存储器,其它指令都不可访问存储器。
- 存储器读写指令基本单位是字节(Byte)。
- RISC-V架构存储模式只支持小端格式。
- RISC-V推荐使用地址对齐的存储器读写操作,但也支持地址非对齐。
- RISC-V架构的存储器读写指令不支持地址自增/自减的模式。
2. RV32I 指令格式
- 下图介绍了六种基本指令格式
- R-type
- 实现rs1,rs2两个寄存器的值运算,并将运算后的结果存在rd中。opcode 和 func 共同决定实现哪种运算。
- I-type
- 可以实现带一个常数的算数指令以及Load指令。 注意immediate字段为补码值。
- 对于Load指令:可以取相对于rd中的基地址+imm字节的数据。
- 例如下面的指令,从x22寄存器中获取基地址,并加上偏移地址(64/8bit = 8Byte) ,取出字,放到x9寄存器中。
- 其中(x)22放在rs1寄存器中,(x)9放在rd字段,64放在imm字段。
lw x9, 64(x22)
- 例如下面的指令,从x22寄存器中获取基地址,并加上偏移地址(64/8bit = 8Byte) ,取出字,放到x9寄存器中。
- 考虑到逻辑操作中的移位,使用的也是I型指令格式,考虑到寄存器位宽为32bit,所以shamt也不会超过32,所以imm只需要划出5bit空间,其余几bit作为额外的操作码字段。
- S-type
- 用于Store指令,immediate字段仍为补码值。
- 存在两个源寄存器,一个存放基址,一个存放数据。
- 设计选择与R-type保持类似的指令格式,将imm进行拆分,可以一定程度降低硬件的复杂性。
- 例如下面的指令,x9中写着要存入的值,x10中写着存储器基地址,并加上偏移地址(240/8bit = 30Byte)。
- 其中(x)9放在rs2字段中,(x)10放在rs1字段中,240放在imm字段中(要被拆分)。
sw x9, 240(x10)
- 例如下面的指令,x9中写着要存入的值,x10中写着存储器基地址,并加上偏移地址(240/8bit = 30Byte)。
- U-type
- I、S型指令格式中已经有12bit imm,但是需要考虑有时常数很大,12bit不够,此时可以使用LUI指令。
- 将高20bit常数加载到寄存器的第31-12bit,低12bit用常数0填充。之后可以使用 addi 指令与低12bit立即数相加,以实现对32bit寄存器数值的配置。
- 上面介绍的ADDI和LUI指令结和还需注意一个问题,即如果ADDI的立即数将本来一个数据为设置为一个符号位,可能会造成一个数据缺口,需要进行补值。相关处理可以看这篇文章。
- I、S型指令格式中已经有12bit imm,但是需要考虑有时常数很大,12bit不够,此时可以使用LUI指令。
- B-type
- 比较两个源寄存器rs1和rs2,并进行跳转。
- 例子如下:
- 指令格式上可以看到imm[0]被舍弃掉了,因为该bit被设置为0;汇编器根据label的地址计算出相对的偏移量为16bytes = 'b1_0000,映射如下图。
beq x19, x10, label
- 看到这里,其实就会有一个疑问,为什么B型和J型立即数在inst中分散的奇奇怪怪,但是寄存器却是固定位置的,知乎上搜到了这个问题的一些回答。我认为其中有一个解释的很有道理,为了平衡(寄存器索引到读出寄存器值的时间)和(通过inst生成参与操作的立即数选择逻辑的时间),提高整体的运算速度。
- J-type
- 主要用在无条件跳转指令jal和jalr上。
jal rd, label jalr rd, rsl, imm
- jal
- 主要实现两步:
- J-type和前面介绍的B-type一样,舍弃掉imm[0],强制设置该bit为0;将imm偏移量加到该指令的PC值,得到最终跳转目标地址。RV32I的J指令格式中imm有21bit,但是imm[0]被舍弃掉了,因此可以跳转±2^(21-1) = ±1MB,其中21-1是因为有1bit的符号位。
- 并且将下一条指令的PC(当前指令PC值+4)写入寄存器rd中。+4是因为对于RV32I来说,其指令长度为4个字节,且使用字节寻址。将下一条地址写入寄存器中,是为返回做准备。
- 主要实现两步:
- jalr
- !!注意,jalr不是J型指令格式而是I型指令格式。
- imm的12bit立即数为偏移量,基地址保存在rs1中,两者相加为最终跳转的目标地址。只能跳转±2KB(2^11=2KB,去掉符号位)。
- jalr也需要将下一条指令的PC值写入rd寄存器中。
- 主要用在无条件跳转指令jal和jalr上。