首页 > 编程语言 >【C语言】程序环境,预处理,编译,汇编,链接详细介绍,其中预处理阶段重点讲解

【C语言】程序环境,预处理,编译,汇编,链接详细介绍,其中预处理阶段重点讲解

时间:2024-08-02 21:28:40浏览次数:12  
标签:__ 符号 int 替换 C语言 编译 预处理 define

目录

程序环境

翻译环境

1. 翻译环境的两个过程

2. 编译过程的三个阶段 

执行环境 

预处理(预编译) 

1. 预定义符号

2. #define 

2.1 用 #define 定义标识符(符号)

2.2 用 #define 定义宏 

2.3 #define 的替换规则 

2.4 # 和 ## 的用法

2.5 宏和函数

2.6 #undef

3. 命令行定义

4. 条件编译

5. 文件包含

5.1 两种头文件的包含

5.2 嵌套文件包含


程序环境

在ANSI C(标准C)的任何一种实现中,存在两个不同的环境。

1. 翻译环境,在这个环境中源代码被转换为可执行的机器指令。

2. 执行环境,它用于实际执行代码。

.

我们写出的C语言代码是文本信息,计算机不能直接理解,计算机是执行二进制指令的,翻译环境负责将C语言代码转成二进制指令,执行环境负责执行二进制代码。


翻译环境

1. 翻译环境的两个过程

1. 一个工程可以有多个.c(源文件)文件,每个源文件都会单独经过编译器处理生成自己对应的目标文件(.obj),这个过程叫做编译。

2. 多个目标文件和链接库经过链接器的处理,最后生成可执行程序,这个过程叫做链接。

链接库的意思是链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。

2. 编译过程的三个阶段 

翻译环境分为编译和链接两部分,编译又有预处理,编译,汇编三个阶段。

1. 预处理:gcc -E test.c -o test.i

预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。

2. 编译:gcc -S test.c

编译完成之后就停下来,结果保存在test.s中。

3. 汇编:gcc -c test.c

汇编完成之后就停下来,结果保存在test.o中。

.

符号

1. 查看符号,这些符号都是全局的。

2. 每个源文件自己编译阶段符号汇总,汇编阶段形成符号表(符号,对应地址),链接进行所有源文件的符号表合并(相同符号合并,函数定义的符号的地址为有效地址,函数声明的符号的地址为无效地址,选取有效地址)。

比如:下图main.c符号表中_sum地址是无效的,合并的时候选择sum.c符号表的_sum地址。


执行环境 

程序执行的过程:

1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排(例如单片机的烧录),也可能是通过可执行代码置入只读内存来完成。

2. 程序的执行便开始。接着便调用main函数。 

3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack)也就是函数栈帧,存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。

4. 终止程序。正常终止main函数;也有可能是意外终止。


预处理(预编译) 

1. 预定义符号

以下预定义符号会在预处理阶段被替换。

__FILE__ 替换为当前进行编译的源文件名称

__LINE__ 替换为当前的行号

__DATE__ 替换为文件被编译的日期

__TIME__ 替换为文件被编译的时间

__STDC__ 如果编译器遵循ANSI C,其值为1,否则未定义

.

2. #define 

2.1 用 #define 定义标识符(符号)

语法:

#define name stuff

例子:

用 MAX 代表1000。

#define MAX 1000

为 register 这个关键字,创建一个简短的名字。

#define reg register

用更形象的符号来替换一种实现。

#define do_forever for(;;)

在写 case 语句的时候自动把 break 写上。

#define CASE break;case

如果定义的 stuff 过长,可以分成几行写,除了最后一行外,每行的后面都加一个反斜杠(续行符)。

#define DEBUG_PRINT printf("file:%s\tline:%d\t\
                            date:%s\ttime:%s\n" ,\
                            __FILE__,__LINE__ ,\
                            __DATE__,__TIME__ )

提问:在define定义标识符的时候,要不要在最后加上;

答:不会直接报错,但没必要加,因为

1. 这只是单纯的替换,如果你加了分号,万一代码那边也写了分号,就会出现两个分号。

2. 不方便进行运算和逻辑执行,替换后你多一个分号有时候会影响原先代码的逻辑。

2.2 用 #define 定义宏 

语法:

其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在 stuff 中。

#define name(parament-list) stuff 

用法:

#define MAX(x, y) (x>y ? x : y)

这个写法其实不够严谨,因为传进来的可能是多项式,所以尽量加上括号。

#define MAX(x, y) ((x)>(y) ? (x) : (y))

这个替换会发生在预处理阶段。


带副作用的宏参数 

x+1;//不带副作用
x++;//带有副作用

例子

#define MAX(a, b)  ( (a) > (b) ? (a) : (b) )
 
x = 5;
y = 8;
z = MAX(x++, y++);

z 就会替换为 z = ( (x++) > (y++) ? (x++) : (y++));

副作用就是表达式求值的时候出现的永久性效果。

2.3 #define 的替换规则 

在程序中扩展 #define 定义的符号和宏时,需要涉及几个步骤。

1. 在调用宏时,首先对参数进行检查,看看是否包含任何由 #define 定义的符号。如果有,那它们首先被替换,替换后的文本被插入到程序中原来文本的位置。

2. 然后参数被宏的值所替换。

3. 最后,再次对结果文件进行扫描,看看它是否包含任何由 #define 定义的符号。如果有,就重复上述处理过程。

注意:

1. 宏参数和 #define 定义中可以出现其他 #define 定义的符号。但是宏不能出现递归。

2. 当预处理器搜索 #define 定义的符号时,字符串常量的内容并不被搜索。

2.4 # 和 ## 的用法

1. # 的用法:把宏的参数插入到字符串中。

例子:

#define PRINT(n) printf("the value of n is %d\n", n)

int main()
{
    int a = 10;
    PRINT(a);
    
    int b = 20;
    PRINT(b);

    return 0;
}

问题:字符串中的n没有被替换。

解决办法:在 n 前面加一个 #

#define PRINT(n) printf("the value of "#n" is %d\n", n)

int main()
{
    int a = 10;
    PRINT(a);
    
    int b = 20;
    PRINT(b);

    return 0;
}

题外话:字符串的双引号是可以连接的。

比如:


2. ## 的用法:可以把位于它两边的符号合成一个符号。

例子:

将 a 和 b 连起来变成 ab。

#define CAT(x, y) x##y

int main()
{
    int ab = 10;
    printf("%d\n", CAT(a, b));
    printf("%d\n", ab);

    return 0;
}

2.5 宏和函数

宏的优点

1. 执行简单的运算时,选择用宏而不是函数。

原因:

用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多,所以宏比函数在程序的规模和速度方面更胜一筹。

函数的参数必须声明为特定的类型,宏是类型无关的,所以函数只能在类型合适的表达式上使用。

2. 宏的参数可以出现类型,但是函数做不到。

#define MALLOC(num, type) (type*)malloc(num*sizeof(type))

MALLOC(10, int);
//预处理器替换之后:
(int*)malloc(10*sizeof(int));

宏的缺点

1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。

2. 宏是没法调试的。

3. 宏由于类型无关,也就不够严谨。

4. 宏可能会带来运算符优先级的问题,导致程容易出现错。


宏与函数对比


命名约定

1. 宏名全部大写

2. 函数名不要全部大写

2.6 #undef

这条指令用于移除一个宏定义。

如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。

例子:

3. 命令行定义

许多 C 的编译器提供了一种能力,允许在命令行中定义符号。用于启动编译过程。

例子:

 #include <stdio.h>
 int main()
 {
     int array [ARRAY_SIZE];
     int i = 0;
     for(i = 0; i< ARRAY_SIZE; i ++)
     {
         array[i] = i;
     }
     for(i = 0; i< ARRAY_SIZE; i ++)
     {
         printf("%d " ,array[i]);
     }
     printf("\n");
     return 0;
 }

编译指令:

gcc -D ARRAY_SIZE=10 programe.c

4. 条件编译

在编译一个程序的时候,条件编译指令可以将一条语句或一组语句进行编译或者放弃编译。

常见的条件编译指令:

1. 单分支的条件编译,常量表达式由预处理器求值。

 #if 常量表达式
    //...
 #endif
 
如:
#define __DEBUG__ 1

#if __DEBUG__
     //..
#endif

2. 多分支的条件编译

#if 常量表达式
    //...
#elif 常量表达式
    //...
#else
    //...
#endif

3. 判断是否被定义,各自有两种写法。

#if defined(symbol)
    //...
#endif

#ifdef symbol
    //...
#endif

#if !defined(symbol)
    //...
#endif

#ifndef symbol
    //...
#endif

4. 嵌套指令

#if defined(OS_UNIX)
    #ifdef OPTION1
        unix_version_option1();
    #endif
    #ifdef OPTION2
        unix_version_option2();
    #endif
#elif defined(OS_MSDOS)
    #ifdef OPTION2
        msdos_version_option2();
    #endif
#endif

5. 文件包含

5.1 两种头文件的包含

本地文件包含

#include "filename"

查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件,如果找不到就提示编译错误。


库文件包含

#include <filename.h>

查找策略:查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。


题外话

1. 其实库文件包含也能用双引号,但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。

2. #include 指令可以使另外一个文件被编译,就像它实际出现于一样。

这种替换的方式很简单:预处理器先删除这条指令,并用包含文件的内容替换。

这样一个源文件被包含10次,那就实际被编译10次。

5.2 嵌套文件包含

comm.h 和 comm.c 是公共模块。

test1.h 和 test1.c 使用了公共模块。

test2.h 和 test2.c 使用了公共模块。

test.h 和 test.c 使用了 test1 模块和 test2 模块。

这样最终程序中就会出现两份 comm.h 的内容,这样就造成了文件内容的重复。


解决办法有两种

1. 条件编译

#ifndef __TEST_H__

#define __TEST_H__
... //头文件的内容

#endif   

2. 头文件开头写:

#pragma once

这样就可以避免头文件的重复引入。

林宇恒/code_c - 码云 - 开源中国 (gitee.com)

标签:__,符号,int,替换,C语言,编译,预处理,define
From: https://blog.csdn.net/m0_71164215/article/details/140749511

相关文章

  • C语言指针与数组
    在上一篇对指针介绍的文章当中,我们初次了解到了指针,并且知道了地址和内存间的关系,懂得了如何取地址和对指针的解引用,算是对指针有了一个初步的了解。而今天让我们对指针进行更深一步的了解吧~一、指针与数组名我们知道,指针变量是一个用来存放地址的变量,比如我们定义一个整形......
  • 嵌入式软件--C语言高级 DAY 8.5 相关函数
    递归函数在嵌入式中应用不常见,但对于学习C语言的我们,也要时刻记得它的作用和用法。此外还要记住sprintf尤其重要!还有时间戳!一、递归函数1.概念一个函数在函数体内又调用了本身。但必须满足两个条件:具有明显的结束条件;趋近于结束条件的趋势。2.递归原理#include<stdio.h>......
  • 嵌入式软件--C语言高级 DAY 7数组
    一、概念数组array:是多个相同类型数据按一定顺序排列的集合,并使用一个标识符命名。并通过编号(索引,亦称为下标或角标)的方式对这些数据进行统一管理。数组的长度=元素的个数标号角标是从0开始。二、define_array.c定义数组的三种形式:1.定义数组,可以先确定数组的元素个......
  • C语言数据在内存中的存储超详解
    文章目录1.整数在内存中的存储2.大小端字节序和字节序判断2.1什么是大小端?2.2为什么会有大小端?2.3练习3.浮点数在内存中的存储3.1一个代码3.2浮点数的存储3.2.1浮点数存的过程3.2.2浮点数取的过程3.3题目解析1.整数在内存中的存储在操作符......
  • C语言自定义类型结构体与位段超详解
    文章目录1.结构体类型的声明1.1结构体声明1.2结构体变量的创建和初始化1.3结构体的特殊声明1.3结构体的自引用2.结构体内存对齐2.1对齐规则2.2为什么存在内存对齐2.3修改默认对齐数3.结构体传参4.结构体实现位段4.1什么是位段4.2位段成员的内存......
  • SQLite库笔记:下载编译
    SQLite是一个C语言库,它实现了一个小型、快速、自包含、高可靠性、全功能的SQL数据库引擎。它广泛应用于计算机、手机和嵌入式设备。SQLite源代码在公有领域(publicdomain),据SQLite官网介绍说可以免费使用,不需要license。1.源码包下载https://www.sqlite.org/download.html2.......
  • c语言中的地址与指针的概念,及变量的指针和指向变量的指针变量
    C语言中的地址、指针、以及变量的指针与指向变量的指针变量。1.地址(Address)在C语言中,每个变量在内存中都有一个唯一的内存地址。这个地址是变量存储的位置的标识符。可以通过& 运算符来获取一个变量的地址。#include<stdio.h>intmain(){  intx=10;  ......
  • c语言结构体的概述,定义结构体变量类型的方法,结构体变量的引用,结构体变量的初始化,结构
    1.C语言结构体的概述在C语言中,结构体(struct)是一种复合数据类型,用于将不同类型的数据组合在一起。它可以包含基本数据类型(如int、float、char等)以及其他结构体。结构体非常适合表示具有多种属性的复杂数据,如学生信息(包含姓名、年龄、成绩等)或坐标点(包含x和y坐标)。结构......
  • c语言(8.2)
    今天练习了n项求和,统计素数求和,99乘法表#include<stdio.h>intmain(){ doublefz=2; doublefm=1; intN; doublesum=0; scanf_s("%d",&N); for(inti=1;i<=N;i++) { sum=sum+fz/fm; doubletemp=fz; fz=fz+fm; fm=t......
  • 【数据结构算法经典题目刨析(c语言)】判断链表是否有环(图文详解)
    ......