首页 > 系统相关 >Linux04

Linux04

时间:2023-02-20 09:45:47浏览次数:77  
标签:Linux04 movl cfi rbp 寄存器 main rax

编译工具链

IDE(集成开发环境):visual studio,clion,Eclipse,xcode

SDK(software Development Kit):软件开发工具包

GCC(GNU C Compiler)

// 查看gcc版本
gcc -v

预处理(-E)

作用:执行预处理指令

常见的预处理指令

  1. #include<stdio.h>

  2. #define N 5

  3. #define SIZE(a)(sizeof(a)/sizeof(a[0]))

  4. 宏开关

宏开关

// 一般很少用
#if 
//...
#else
//...
#endif
// 条件编译
#ifdef
//...
#else
//..
#endif

//ex:
#include <stdio.h>
int main(void)
{
#ifdef N
   printf("Hello world\n");
#else
   printf("I love xjl~\n");                                  
#endif
	return 0;
}

预处理指令:

// 防御或声明,防止头文件被包含多次
#ifndef
//...
#else
//...
#endif

编译(-S)

作用:把预处理后的代码翻译成汇编代码

gcc -S main.c -o main.s

汇编基础

基本操作

push(入栈) mov(移动) call(函数调用) ret(函数返回)

pop(出栈) lea(load effective address,加载有效地址,等价于取地址&)

寄存器

寄存器是 CPU 内部用来存放数据的一些小型存储区域 ,用来暂时存放参与运算的数据和运算结果。在计算机领域,寄存器是CPU内部的元件,包括通用寄存器专用寄存器控制寄存器。寄存器拥有非常高的读写速度,所以在寄存器之间的数据传送非常快。

  • 有16个常用寄存器

​ %rax、 %rbx、 %rcx、 %rdx、 %rsi、 %rdi、 %rbp、 %rsp

​ %r8、 %r9、 %r10、 %r11、 %r12、 %r13、 %r14、 %r15

  • 寄存器大小

​ 1、r开头的寄存器都是64位8字节的
​ 2、e开头的寄存器是32位4字节的
​ 3、l和h结尾的寄存器是16位2字节的

特殊的寄存器

%rbp:register base pointer(栈帧的基址寄存器)

%rsp:register stack pointer(栈顶的地址)

%rdi:参数寄存器 第一个参数

%edi:参数寄存器 第一个参数(存放32bits的数据)

%rsi:参数寄存器 第二个参数

%esi:参数寄存器 第二个参数(存放32bits的数据)

%rax:返回值寄存器

%eax:返回值寄存器(存放32bits数据)

(%eax是寄存器的低32位,%rax是寄存器的整个64位;%rdi和%edi同理 )

栈帧的大小:(%rbp) - (%rsp)

数据单位

x86架构:

​ 数据总线:16bits

​ 地址总线:20bits

​ word:16bits

long word:32bits(l)

quadra word:64bits(q)

//q、l(如:pushq里的这个q)都是数据的单位

main:
.LFB0:
     .cfi_startproc
     pushq   %rbp				// 将上一个函数的基址地址入栈(保存上一函数的基址地址)
     .cfi_def_cfa_offset 16
     .cfi_offset 6, -16
     movq    %rsp, %rbp
     // 以上,push和mov操作,是函数调用的准备工作
     .cfi_def_cfa_register 6
     movl    $.LC0, %edi		// 将"Hello world"字符串字面值的地址保存到edi(参数寄存器)里面去
     call    puts				// 编译器优化,调用puts函数,没有调用printf函数
     movl    $0, %eax			// main函数的返回值是int型(32bits),返回0,存放到返回值寄存器中
     // 到此处,函数功能执行完毕
     popq    %rbp
     .cfi_def_cfa 7, 8
 	 ret
 movq    %rsp, %rbp			// 解释如下图

#include <stdio.h>

void foo(int arr[], int a) {
    int tmp = arr[0];
    arr[0] = a;
    a = tmp;
}

int main()
{
    int j = 10; 
    int arr[] = {1,2,3,4,5};
    arr[2] = 20; 
    int *p = arr + 3;
    *p = 40; 

    int sum = 0;
    for(int i = 0;i < 5;i++)
    {   
        sum += arr[i];
    }   
    
    foo(arr,j);                                                                                                                                            
    return 0;
}

注意:对寄存器的操作,加括号就相当于是解引用,是对寄存器里存放地址所指向的内存空间里的内容进行操作。没有加括号相当于直接对寄存器里的内容进行操作

    .type   foo, @function
foo:
.LFB0:
    .cfi_startproc
    pushq   %rbp
    .cfi_def_cfa_offset 16
    .cfi_offset 6, -16
    movq    %rsp, %rbp
    .cfi_def_cfa_register 6
    movq    %rdi, -24(%rbp)
    movl    %esi, -28(%rbp)
    movq    -24(%rbp), %rax
    movl    (%rax), %eax
    movl    %eax, -4(%rbp)
    movq    -24(%rbp), %rax
    movl    -28(%rbp), %edx
    movl    %edx, (%rax)
    movl    -4(%rbp), %eax
    movl    %eax, -28(%rbp)
    nop
    popq    %rbp
    .cfi_def_cfa 7, 8
    ret 
    .cfi_endproc
.LFE0:
    .size   foo, .-foo
    .globl  main
    .type   main, @function
main:
.LFB1:
    .cfi_startproc                                                                                                                                         
    pushq   %rbp
    .cfi_def_cfa_offset 16
    .cfi_offset 6, -16
    movq    %rsp, %rbp
    .cfi_def_cfa_register 6
    subq    $64, %rsp				// 把%rsp里面的值减去 64 再赋值给%rsp,%rsp -= 64;确定栈帧的大小
    // 为何以下两行不可以用一个mov完成?		
    // 答:现在的架构无法满足直接从一块内存向另一块内存传输数据,必须经过寄存器
    movq    %fs:40, %rax			// %fs:40是内存中的一片空间(只读区域,不可写),段+偏移量
    movq    %rax, -8(%rbp)			// 存放金丝雀值
    xorl    %eax, %eax				// 用异或的方式将返回值寄存器中的内容清零(很常用的清零操作)
    // 接下来 7 行都是赋值操作
    movl    $10, -44(%rbp)			// 将基址地址 -44 字节的内存赋值为 10(int j = 10)	
    movl    $1, -32(%rbp)
    movl    $2, -28(%rbp)
    movl    $3, -24(%rbp)
    movl    $4, -20(%rbp)
    movl    $5, -16(%rbp)
    movl    $20, -24(%rbp)
    // 50-52行:int *p = arr + 3;
    leaq    -32(%rbp), %rax			// 加载有效地址,-32(%rbp)是arr的地址(数组首地址),将该地址存放到%rax寄存器中
    addq    $12, %rax				// %rax里面的值减去12再赋值给%rax
    movq    %rax, -40(%rbp)			// 将%rax 里面的值(地址)保存到 %rbp 减40的位置
    movq    -40(%rbp), %rax
    movl    $40, (%rax)				// 把40存放到%rax所指向的内存空间		即:*p = 40;
    // 56-57行:int sum = 0、int i = 0
    movl    $0, -52(%rbp)			
    movl    $0, -48(%rbp)
    jmp .L3							// 函数内进行跳转,直接执行66行的指令(无条件跳转)
.L4:
    movl    -48(%rbp), %eax			// 将i的值放到%eax中
    cltq					// 将%eax的内存扩充到64位,并将前32位清零
    // -32(%rbp,%rax,4) <=> %rbp - 32 + 4 * %rax <=> arr[i];%rbp - 32即是arr(数组首地址),%rax指向的地址存放的是i的值
    movl    -32(%rbp,%rax,4), %eax		// 将arr[i]的值赋值%eax
    addl    %eax, -52(%rbp)			// <=> sum += arr[i]
    addl    $1, -48(%rbp)			// <=> i++
.L3:
    cmpl    $4, -48(%rbp)			// 比较大小指令,将4 和 i的值进行比较
    jle .L4					// jle(jump less equal),有条件跳转(≤),如果满足≤4,则跳转到.L4
    // 下面开始调用foo函数
    movl    -44(%rbp), %edx			// 将j的值存放到%edx寄存器中
    leaq    -32(%rbp), %rax			// 加载有效地址,将数组首地址加载到%rax寄存器中
    movl    %edx, %esi				// 将%edx中的值存放到%esi寄存器(第二个参数寄存器)
    movq    %rax, %rdi				// 将%rax中的值存放到%rsi寄存器(第二个参数寄存器)
    call    foo					// 调用foo宏函数
    movl    $0, %eax				// 将0存放到%eax寄存器(返回值寄存器)
    movq    -8(%rbp), %rcx			// 把%rbp到%rbp - 8这片内存空间的值存放到%rcx这个寄存器中
    // 将内存中的金丝雀值(39行)与%rcx中的值进行异或运算,来判断是否出现数组越界(如果为0说明没有变动,则未越界;否则越界)
    xorq    %fs:40, %rcx			
    je  .L6					// 判断是否等于 0 ,是的话,jump到.L6,否则调用“栈检查失败”即栈溢出
    call    __stack_chk_fail
.L6:
    leave					// 做一些清理操作
    .cfi_def_cfa 7, 8
    ret						// 函数返回
    .cfi_endproc
.LFE1:
    .size   main, .-main
    .ident  "GCC: (Ubuntu 5.4.0-6ubuntu1~16.04.12) 5.4.0 20160609"
    .section    .note.GNU-stack,"",@progbits

再次理解 pushq %rbp :

push是入栈操作,q代表大小(64位),此时%rbp存放的还是上一个函数栈帧的基址地址,将%rbp里面的内容入栈即保存了上一函数栈帧的基址地址,如图:

随后,还需要将栈顶指针移动到相应位置,实际上此操作是包括了两个步骤的,这两个步骤是不能被中断的,如图:

总之,push操作包含了两个步骤:

​ 1、将基址寄存器里的值(上一函数栈帧的基址地址)入栈

​ 2、将栈帧的栈顶指针移动到相应位置

小结

  • C语言中的变量名对应汇编中的地址
  • C语言中的类型对应汇编中的长度
  • 函数调用都有自己独立的栈帧,并且参数都是值传递
  • 循环是通过跳转实现的

汇编(-c)

作用:将汇编代码转换成目标平台的机器代码

gcc -c main.c -o main.o

链接

作用:为每一个符号(全局变量、函数名)找到对应的定义

gcc main.o -o main

总结

预处理:-E 得到 *.i 文件

编译:-S 得到 *.s 文件

汇编:-c 注意是小写c 得到 *.o 文件

链接:无

定义宏:-D

显示所有警告:-Wall

gcc main.c -o main -Wall

标签:Linux04,movl,cfi,rbp,寄存器,main,rax
From: https://www.cnblogs.com/MyXjil/p/17136278.html

相关文章