《深入理解计算机系统第三版》第三章家庭作业参考答案

标签：rsi 16 rsp 第三版 rdx 家庭作业 rdi 参考答案 rax

简述

最近看docker和k8s的底层实现原理,严重感觉自己对底层的知识了解不足，于是开始业余时间深入看一些底层书籍，就找了本据说是理解整个计算机体系的入门书-《深入理解计算机系统》.直接买的最新的第三版，从第三章开始看的，第二章接下来有心情再看(看了几眼全是如何手算进制间计算之类的感觉用处不是很大)…由于第三版刚出不久，而且题目跟第二版的不一样，网上几乎没有答案。。。于是自己艰难的做完后,就打算把自己的解法和思路放到博客上，基本都是自己做的,大都自己在机器上验证过了(差点累死..),但想必肯定会有很多错误和不足(不知道有多少手残打错的地方)，欢迎同样在看这本书的多多留言交流讨论题目解法，我会积极吸收建议,并不断修正完善我的博文，最重要的是给其他正在看这本书的一个答案参考(其实就是骗访问量)。

第三章的主要内容是汇编语言，刚开始看的时候完全不知所云，前四节看的异常艰难，平均每小时看一页的速度。。。有的地方实在看不懂，就先略过了，看到后面的时候发现用到前面的，就又回过头来看前面的，有时候仅仅这个回头看就是两个多小时,一天光回头看了。。后来终于弄明白前四节之后，大体明白是怎么一个套路了，再看后面几节的时候，速度就很快了，基本就是跟看小说似的一次性过了。。。所以建议前面的一定要认真读,不要心急,慢慢看,找到汇编的套路后后面的就看的飞快了

*3.58

decode2:
    subq    %rdx, %rsi # %rsi = y - z;
    imulq   %rsi, %rdi # %rdi = (y - z) * x;
    movq    %rsi, %rax # %rax = y - z;
    salq    $63,  %rax # %rax = (y - z) << 63;
    sarq    $63,  %rax # %rax = ((y - z) << 63) >> 63;
    xorq    %rdi, %rax # %rax=(((y - z) << 63) >> 63) ^ ((y - z) * x)
    ret

因此相应的C代码为(((y-z)<<63)>>63)^((y-z)*x)

**3.59

这题之前一直没弄明白,原来是我没有仔细看课本3.5.5节,对cqto理解错了..在此感谢下面的评论中给的参考答案 :) .不过确实还是有些地方不太好理解,我下面会尽最大努力讲的清楚一些.(不过我的语文水平堪忧…)
这里有一点需要注意,%rdx与%rax共同代表一个128位数的意思,是指用可以用计算公式%rdx*2^64+%rax来表示这个数,而并不是把这%rdx和%rax的二进制串串连起来表示这个数,区别在于,当这个数为负数的时候,%rdx是-1.意思是所有位都为1,而如果串连起来的话,显然只有%rdx的第一位为1,后面全为0.因此这里的数学公式推理才正确,所以对于汇编的第10行为什么要加上%rcx,就不要用串连起来的表示方法去想象这一行的正确性,而应该用数学公式去推.
下面用x0,y0来分别表示x和y的低位,用x1,y1来分别表示x和y的高位,用W表示2^64,因此下面的公式成立:

p = x * y
   = (x1*W + x0) * (y1*W + y0) 
   = (x1*y1*W*W) + W(x1*y0+x0*y1) + x0*y0

公式中x1*y1*W*W超过了128位,而且未超出128位部分始终全为0,因此可以去掉.于是公式变成了p=W(x1*y0+x0*y1) + x0*y0,然后可以继续转化,注意这里的x0*y0是很可能会超出64位的,假设x0*y0的超出64位的部分为z1,未超出64位的部分为z0.那么公式可以变成如下:

p = W(x1*y0+x0*y1+z1) + z0

很明显,需要将x1*y0+x0*y1+z1放到最终结果的高位,即(%rdi),z0放到最终结果的低位,即8(%rdi)
然后仔细翻译下各个语句

store_prod:
    movq   %rdx, %rax   # %rax = y0.
    cqto                # 有符号运算,因此用cqto,这里会自动关联%rdx和%rax分别表示高位和低位,假如y是负数,那么%rdx所有位都是1(此时值是-1),否则,%rdx全为0, %rdx = y1.
    movq   %rsi, %rcx   # %rcx = x0.
    sarq   $63,  %rcx   # 将%rcx向右移63位,跟%rdx的含义一样,要么是-1,要么是0, %rcx = x1.
    imulq  %rax, %rcx   # %rcx = y0 * x1
    imulq  %rsi, %rdx   # %rdx = x0 * y1
    addq   %rdx, %rcx   # %rcx = y0 * x1 + x0 * y1
    mulq   %rsi         # 无符号计算 x0*y0,并将x0*y0的128位结果的高位放在%rdx,低位放在%rax,因此这里%rdx = z1, %rax = z0.
    addq   %rcx, %rdx   # %rdx = y0*x1+x0*y1+z1
    movq   %rax, (%rdi) # 将%rax的值放到结果的低位
    movq   %rdx, 8(%rdi)# 将%rdx的值放到结果的高位,可以发现跟上面用数学公式推理的结果完全一致!!!!
    ret

**3.60

loop:
    movl  %esi, %ecx # %ecx=n;
    movl  $1, %edx   # %edx=1; --> mask 
    movl  $0, %eax   # %eax=0; --> result
    jmp   .L2
.L3:
    movq  %rdi, %r8  # %r8=x;
    andq  %rdx, %r8  # %r8=x&%rdx; -->x&mask
    orq   %r8, %rax  # %rax=%rax | (x&%rdx); -->result |= x & mask
    salq  %cl, %rdx  # %rdx=%rdx<<(n&0xFF); -->mask<<=(n&0xFF)
.L2:
    testq %rdx, %rdx
    jne   .L3.       # if %rdx!=0 goto L3. -->mask!=0
    rep; ret

%rdi, %r8 --> x
%esi, %ecx --> n
%rdx --> mask
%rax --> result

result = 0;
mask = 1；

mask != 0

mask<<=(n&0xFF)

result |= x & mask

long loop(long x, int n)
{
    long result = 0;
    long mask;
    for(mask = 1;mask != 0;mask = mask << (n&0xFF)){
        result |= x & mask;
    }
    return result;
}

**3.61

传送指令会对条件分别求值，于是假如xp为空指针，那么这里产生对空指针读数据的操作，显然是不可以的。于是这里不能存在*xp,可以用指针来代替，最后判断出值之后，再进行读取数据，因此这里0也必须赋予一个地址，于是需要加个变量来存储0这个数字。因此答案可以是：

long cread_alt(long *xp)
{
    int t=0;
    int *p = xp ? xp : &t;
    return *p;
}

**3.62

这个题就是纯翻译汇编，没有什么可讲的。

case MODE_A:
    result = *p2;
    action = *p1;
    *p2 = action;
    break;
case MODE_B:
    result = *p1 + *p2;
    *p1 = result;
    break;
case MODE_C:
    *p1 = 59;
    result = *p2;
    break;
case MODE_D:
    result = *p2;
    *p1 = result;
    result = 27;
    break;
case MODE_E:
    result = 27;
    break;
default:
    result = 12;

**3.63

<switch_prob>:
    400590: 48 83 ee 3c    sub $0x3c, %rsi
    # 说明下面的数都要加上60 
    400594: 48 83 fe 05    cmp $0x5, %rsi
    400598: 77 29          ja  4005c3 <switch_prob+0x33>
    # 如果大于65，跳到4005c3那一行
    40059a: ff 24 f5 f8 06 40 00   jmpq *0x4006f8(,%rsi,8)
    # 跳到跳转表对应的位置，假设跳转表对应数组a[x],那么分别跳到a[0x4006f8+8*(n-60)]的位置
    4005a1: 48 8d 04 fd 00 00 00   lea  0x0(,%rdi,8),%rax
    # 60和62会跳到这个位置
    4005a8: 00
    400593: c3             retq
    4005aa: 48 89 f8       mov %rdi, %rax
    # 63会跳到这个位置
    4005ad: 48 c1 f8 03    sar $0x3, %rax
    4005b1: c3             retq
    4005b2: 48 89 f8       mov %rdi, %rax
    # 64会跳到这个位置
    4005b5: 48 c1 e0 04    shl $0x4, %rax
    4005b9: 48 29 f8       sub %rdi, %rax
    4005bc: 48 89 c7       mov %rax, %rdi
    4005bf: 48 0f af ff    imul %rdi, %rdi
    # 65会跳到这个位置
    4005c3: 48 8d 47 4b    lea 0x4b(%rdi), %rax
    # 大于65和61会跳到这个位置
    4005c7: c3             retq

根据上面的分析过程可得答案如下：

long switch_prob(long x, long n){
    long result = x;
    switch(n):{
        case 60:
        case 62:
            result = x * 8;
            break;
        case 63:
            result = result >> 3;
            break;
        case 64:
            result = (result << 4) - x;
            x = result;
        case 65:
            x = x * x;
        case 61: # 也可以去掉这行
        default:
            result = x + 0x4b;
    }
}

***3.64

store_ele:
    leaq  (%rsi, %rsi, 2), %rax  # %rax = 3 * j
    leaq  (%rsi, %rax, 4), %rax  # %rax = 13 * j
    leaq  %rdi, %rsi             # %rsi = i
    salq  $6, %rsi               # %rsi * = 64
    addq  %rsi, %rdi             # %rdi = 65 * i
    addq  %rax, %rdi             # %rdi = 65 * i + 13 * j
    addq  %rdi, %rdx             # %rdx = 65 * i + 13 * j + k
    movq  A(, %rdx, 8), %rax     # %rax = A + 8 * (65 * i + 13 * j + k)
    movq  %rax, (%rcx)           # *dest = A[65 * i + 13 * j + k]
    movl  $3640, %eax            # sizeof(A) = 3640
    ret

&D[i][j][k] = X_D + L(i * S * T + j * T + k)

由A题目中的公式以及汇编至第9行第10行计算出来的可得：

S * T = 65
T = 13
S * T * R * 8 = 3640

很容易可以计算出来

R = 7
S = 5
T = 13

*3.65

.L6:
    movq  (%rdx), %rcx  # t1 = A[i][j]
    movq  (%rax), %rsi  # t2 = A[j][i]
    movq  %rsi, (%rdx)  # A[i][j] = t2
    movq  %rcx, (%rax)  # A[j][i] = t1
    addq  $8, %rdx      # &A[i][j] += 8
    addq  $120, %rax    # &A[j][i] += 120
    cmpq  %rdi, %rax    
    jne   .L6           # if A[j][i] != A[M][M]

从2～5行里无法区分A[i][j]和A[j][i]，只能从第6和7行来看，A[i][j]每次只移动一个单位，所以每次+8的寄存器%rdx就是指的A[i][j]。

因为寄存器%rdx是A[i][j]，所以另一个寄存器%rax是A[j][i]。

A[j][i]每次移动一行的距离，所以可得公式:8 * M = 120,显然，M=15。

*3.66

sum_col:
    leaq   1(, %rdi, 4), %r8        # %r8 = 4 * n + 1
    leaq   (%rdi, %rdi, 2), %rax    # result = 3 * n
    movq   %rax, %rdi               # %rdi = 3 * n
    testq  %rax, %rax
    jle    .L4                      # if %rax <= 0, goto L4
    salq   $3, %r8                  # %r8 = 8 * (4 * n + 1)
    leaq   (%rsi, %rdx, 8), %rcx    # %rcx = A[0][j]
    movl   $0, %eax                 # result = 0
    movl   $0, %edx                 # i = 0
.L3:
    addq   (%rcx), %rax             # result = result + A[i][j]
    addq   $1, %rdx                 # i += 1
    addq   %r8, %rcx                # 这里每次+8*(4n+1),说明每一行有4n+1个，因此NC(n)为4*n+1
    cmpq   %rdi, %rdx               
    jne    .L3                      # 这里说明一直循环到3*n才结束，所以可以说明一共有3n行，因此NR(n)为3*n
    rep; ret
.L4:
    movl $0, %eax
    ret

根据上述代码中的分析，可以得出

NR(n) = 3 * n
NC(n) = 4 * n + 1

**3.67

这个的汇编翻译很简单，基本都是直接在栈上赋值，就不再一句句翻译了.
这里要注意一点!!也是我想了很长时间的一点,就是当调用一个函数时,%rsp会减去8来存一个返回地址,因此process里的24(%rsp),16(%rsp),8(%rsp)分别对应着原来的16(%rsp),8(%rsp),(%rsp)!!

相对于%rsp的偏移量	存储的值
%rsp+24	z
%rsp+16	&z
%rsp+8	y
%rsp	x

传的是%rsp+64表示的栈地址,而不是结构体s.

直接通过%rsp+偏移量的栈地址来访问的s的值.

通过所传的表示栈地址的参数,来间接存储在栈上.

完成eval时的栈帧图应该是:

相对于%rsp的偏移量	存储的值
%rsp+80	z
%rsp+72	x
%rsp+64	y
%rsp+32
%rsp+24	z
%rsp+16	&z
%rsp+8	y
%rsp	x

在从process返回后,eval是通过直接通过访问的%rsp+偏移量来访问的结构r的元素.

在涉及结构体这种无法用一个寄存器存储的参数时,不管是传入还是返回,都是直接通过在栈上的存储来进行访问的.

PS: 写完这个题的题解,深感自己的语文水平的捉急……不懂得留言问吧…

***3.68

首先,结构体str2类型的最长单位是long,所以按照8位对齐,str1同样,也是按照8位对齐.
再来看汇编代码:

setVal:
    movslq  8(%rsi), %rax
    # 说明str2的t从第8位开始的,因为按照8位对齐,因此sizeof(array[B])小于等于8
    # 因为下边的t是int类型,只占4个字节,为了不让t与array共占8个字节,所以sizeof(array[B])大于4,因此可得5<=B<=8.
    addq    32(%rsi), %rax
    # 说明str2的u从第32位开始的,因此t与s占了24个字节,可以将2个s放在t的一行,占满8个字节,剩下的s占据两行,因此可得7<=A<=10.
    movq    %rax, 184(%rdi)
    # 说明str1的y从第184位开始的,因此184-8<A*B*4<=184

根据汇编代码推出的三个公式:

5<=B<=8
7<=A<=10
184-8<A*B*4<=184

可以算出唯一解为:

A=9
B=5

***3.69

这个题…当时把0x120忘记是16进制,按照10进制的120来算的…导致算了好长时间..一度以为题目又出错了…
这题真的是好题..前后逻辑性非常强,每行代码都很关键,都可以推出很多推论来,缺少了任意一个推论,这题都无法做出来,强烈建议仔细思考,尽量争取自己做出来

<test>:
    mov    0x120(%rsi), %ecx
    # 这句话是访问bp的first,说明first与a一共占了288个字节
    add    (%rsi), %rcx
    # %rcx = n
    lea    (%rdi, %rdi, 4), %rax
    # %rax = 5 * i
    lea    (%rsi, %rax, 8), %rax
    # %rax = &bp + 40 * i
    mov    0x8(%rax), %rdx
    # ap->idx = %rax + 8
    # 这两句表明了&bp->a[i]的地址计算公式,即&bp+8+40i,因此可以说明,a的总大小是40
    # +8说明first自己占8个字节,按照的8位对齐,因此a的第一个元素肯定是8个字节的.
    movslq %ecx, %rcx
    # 在这里将n进行了类型转换,int型转换成了long型,因此说明ap里的x数组一定是long型
    mov    %rcx, 0x10(%rax, %rdx, 8)
    # 这句说明了ap->x[ap->idx]的地址计算公式是&bp + 16 + idx * 8
    # +16说明了包含了first以及idx,说明idx是a的第一个元素,根据上面得出的第一个元素肯定是8个字节的结论,说明idx是long类型.
    # 再因为一共占大小40,所以x数组的元素个数为(40 - 8) / 8 = 4
    retq

CNT = (288 - 8) / 40 = 7

typedef struct {
    long idx;
    long x[4];
}

***3.70

前两问很基础,直接说答案,注意是union类型,不会的需要再仔细翻下书咯.

e1.p     0
e1.y     8
e2.x     0
e2.next  8

这一问比较有难度,逻辑性也很强,还是建议尽量能够自己推出来.下面来仔细推一下,这题就不好从头开始一句句的推了, 需要跳跃性的推理(什么鬼).

1   proc:
2       movq    8(%rdi), %rax
3       movq    (%rax), %rdx
4       movq    (%rdx), %rdx
5       subq    8(%rax), %rdx
6       movq    %rdx, (%rdi)
7       ret

先来看proc的C代码,等式右边中间有个减号,因此,可以去汇编里找到第5行的subq,所以2~4行就是赋值的被减数.
第3行和第4行代码分别加了两次星号,因此可以说明是*(*(A).B)结构,根据第二行,因为是偏移量+8,取得是第二个值,e1.y不是指针,因此只能是e2.next,于是A为e2.next;同理,B说明也是指针,没有偏移量,是取得第一个值,因此只能是e1.p.所以被减数就推出来了为*(*(up->e2.next).e1.p)
再看第5行,减数的偏移量是相对于%rax+8,上一条步骤中,%rax是*(up->e2.next),取第二个值,而且汇编代码中并未加星号,因此说明不是指针,那么只能e1.y,因此减数是*(up->e2.next).e1.y
最后只剩等式左边,来看第6行,偏移量为0说明取得第一个值,且从C代码中看未加星号,因此不是指针,所以只能是e2.x.

根据上述推理,可以得出C代码为:

void proc(union ele *up){
    up->e2.x = *(*(up->e2.next).e1.p) - *(up->e2.next).e1.y;
}

*3.71

不知道对不对……

#include <stdio.h>
void good_echo()
{
    char str[SIZE];
    while(1){
        char *p = fgets(str, SIZE, stdin);
        if (p == NULL) {
            break;
        }
        printf("%s",p);
    }
}

**3.72

aframe:
    pushq   %rbp
    movq    %rsp, %rbp
    subq    $16, %rsp
    # 将栈顶地址减小16
    leaq    30(,%rdi,8), %rax
    # %rax = 8 * n + 30
    andq    $-16, %rax
    # 这里的原因跟课本中的那一处一样的道理,将后4位置0,成为最大的16的倍数.
    subq    %rax, %rsp
    # 将栈顶地址减小%rax位
    leaq    15(%rsp), %r8
    andq    $-16, %r8
    # 这两句是保证了p的地址是16的倍数,取最小的16的倍数.

s2 = s1 - ((8 * n + 30) & 0xfffffff0)
因此:
if n % 2 == 0:
    s2 = s1 - (8 * n + 16)
else:
    s2 = s1 - (8 * n + 24)

p = (s2 + 15) & 0xfffffff0

这题感觉很好,逻辑难度不大,但是要求对题目所需知识点的要求比较高.可以对着p203的图来看.然后注意,这题很明显并不是求具体的值,可以看出n在这里只有奇偶之分,s1看对16取余后的值.

首先来看使e1最小,那么e2则是最大,如果要e2最大的话,因为这里是要16倍数的最小值,因此p最小则为某个对16取余为1的值,这时e2是15,e2不可能会大于等于16了.然后使e1+e2的和也最小,则是n为偶数时,是8n+16-8n,为16,因此答案是: e1为16-e2=1,此时n为偶数,s1%16=1.
使e1最大,则e2最小,e2最小则为p恰好是16的倍数,此时e2为0.然后使e1+e2的和也最大,则是n为奇数时,是8n+24-8n,为24,因此答案是: e1为24-e2=24,此时n为奇数,s1%16=0.

s2保证了能容下8 * n字节的最小的16的倍数.
p保证了自身对16对齐.

*3.73

很简单的一道题,直接用4个跳转就可以了.

find_range:
    vxorps %xmm1, %xmm1, %xmm1
    vucomiss %xmm1, %xmm0
    jp .L1
   ja .L2
   jb .L3
   je .L4
   .L2:
   movl $2, %eax
   jmp .Done
   .L3:
   movl $0, %eax
   jmp .Done
   .L4:
   movl $1, %eax
   jmp .Done
   .L1:
   movl $3, %eax
   .Done

**3.74

跟上题差不多,区别是用条件传送而不是条件分支.同样不难.

find_range:
    vxorps %xmm1, %xmm1, %xmm1
    movq $0, %r8
    movq $1, %r9
    movq $2, %r10
    movq $3, %rax
    vucomiss %xmm1, %xmm0
    cmovl %r8, %rax
    cmove %r9, %rax
    cmova %r10, %rax

*3.75

很简单….找规律就行了

对于第n个参数,则imag部分传%xmm(2n-1),real部分传%xmm(2n-2)

imag部分返回值%xmm1, real部分返回值%xmm0.

标签：rsi,16,rsp,第三版,rdx,家庭作业,rdi,参考答案,rax
From： https://blog.51cto.com/u_16070138/6188457