标签：计算机系统操作数机器 3.4 指令深入内存寄存器 64

3.3 数据格式

由于是从16位体系结构扩展成32位的，Intel用术语“字(word)”表示16位数据类型。因此，称32位数为“双字(double words/long word)”，称64位数为“四字(quad words)”。

大多数GCC生成的汇编代码指令都有一个字符的后缀(b/w/l/q)，表明操作数的大小。

注意：汇编代码同时使用后缀'l'来表示4字节整数和8字节双精度浮点数。这不会产生歧义，因为浮点数使用的是一组完全不同的指令和寄存器。

3.4 访问信息

一个x86-64的中央处理单元(CPU)包含一组16个存储64位值的通用目的寄存器，用来存储整数数据和指针。

指令集的历史演化造成了不同的命名规则：最初的8086中有8个16位寄存器(%ax~%sp)，每个寄存器都有特殊的用途。扩展到IA32架构时，寄存器扩展成32位寄存器(%eax~%esp)。扩展到x86-64后，原来的8个寄存器扩展成64位(%rax~%rsp)，还增加了8个新的寄存器(%r8~%r15)。

两条规则：

生成1字节和2字节数字的指令会保持剩下的字节不变。

生成4字节数字的指令会把高位4个字节置为0。

%rsp是栈顶指针，用来指明运行时栈的结束位置。（一般不在其它情况下使用）
注意参数的使用顺序：%rdi->%rsi->%rdx->%rcx。
返回值存入%rax中。

3.4.1 操作数指示符

大多数指令有一个或多个操作数(operand)，指示出执行一个操作中要使用的源数据值，以及放置结果的目的位置。有以下三种类型：

立即数(immediate)，表示常数值。书写方式：'$'后面跟一个用标准C表示法表示的整数。（不同指令允许的立即数值范围不同，汇编器会自动选择最紧凑的方式进行数值编码。）
寄存器(register)，表示某个寄存器的内容。书写方式：用符号$r_a$表示任意寄存器$a$，用引用$R[r_a]$来表示它的值。（这是将寄存器集合看成一个数组R，用寄存器标识符作为索引。）
内存(memory)引用，根据计算出来的有效地址访问某个内存位置。书写方式：用符号$M_{b}[Addr]$表示对存储在内存中从地址$Addr$开始的$b$个字节值的引用，通常省去下标$b$。（同样将内存看成一个很大的字节数组。）

如下图所示，有多种不同的寻址模式，允许不同形式的内存引用。
$Imm(r_b, r_i, s)$是最常用的表示形式，有四个部分：一个立即数偏移$Imm$，一个基址寄存器$r_b$，一个变址寄存器$r_i$和一个比例因子$s$(1/2/4/8)。有效地址被计算为$Imm+R[r_b]+R[r_i]·s$。