15C语言预处理
一、程序的翻译环境和执行环境
程序从.c文件到.exe文件依赖的是翻译环境,而.exe以后的执行依赖的是执行环境
1.1翻译环境
在这个环境中,我们写的源代码被翻译成可执行的机器指令(二进制信息),也就是说,翻译环境将文本文件(.c文件)转换成二进制文件(.exe),当存在多个.c文件时,会单独生成它们对应的目标文件,最后再链接成一个可执行文件。
在上面的过程中,由编译器处理的过程叫做编译,有链接器处理的过程叫做链接。
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
- 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。
也就是说在链接时,链接器会将库函数的静态库与目标文件进行链接,这样我们才能使用库函数。
以之前的扫雷文件为例:
1.1.1编译的过程
编译又分为预编译(预处理)、编译、汇编三个过程。
预编译阶段大致分为以下操作:
- #include头文件的包含,会将头文件中的内容拷贝一份
- 删除注释,使用空格替换注释
- #define替换操作
总之预编译阶段的操作为文本操作,操作结束以后生成.i的文本文件。
编译阶段则是将C语言代码翻译成汇编代码,进行的操作有语法分析、词法分析、语义分析、符号汇总等,翻译完成以后生成.s文件。
汇编阶段将汇编代码转化成二进制代码,并且形成符号表。
1.1.2链接的过程
在编译阶段完成以后会生成多个.obj的文件,在链接阶段,链接器进行合并段表、符号表的合并和符号表的重定位等操作,将多个.obj文件链接在一起,生成一个.exe可执行文件。
综上,上述的翻译过程如图所示:
1.2执行环境
程序执行的过程:
- 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
- 程序的执行便开始。接着便调用main函数。
- 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
- 终止程序。正常终止main函数;也有可能是意外终止。
二、预处理(预编译)详解
2.1预定义符号
C语言中有很多已经定义好的符号,可以直接拿来使用:
__FILE__ //进行编译的源文件
__LINE__ //文件当前的行号
__DATE__ //文件被编译的日期
__TIME__ //文件被编译的时间
__STDC__ //如果编译器遵循ANSI C,其值为1,否则未定义
这些符号可以用来写日志文件。
2.2#define
#define在之前提到过,这里再进行一些补充。
由于#define是完全替换的,因此可以用来定义标识符:
#define MAX 1000
#define reg register //为 register这个关键字,创建一个简短的名字
#define CASE break;case //在写case语句的时候自动把 break写上。
//给函数创建一个简短的名字
#define DEBUG_PRINT printf("file:%s\tline:%d\t \ date:%s\ttime:%s\n" ,
__FILE__,__LINE__ , __DATE__,__TIME__ )
由于#define是直接替换的,因此在定义标识符的时候,最好不要加标点,否则很容易出错,比如:
#define MAX 1000;
int main()
{
int i;
i = MAX;
printf("%d",MAX);//替换以后相当于 printf("%d",1000;),会出现语法错误
}
#define 还可以定义宏
#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(definemacro)。
下面是宏的申明方式:
#define name( parament-list ) stuff 其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。
注意: 参数列表的左括号必须与name紧邻。 如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。
对于一些比较简单的函数,可以用宏定义来实现:
#define ADD(a,b) a+b
#include<stdio.h>
int main()
{
int i = 3, j = 4;
int ret = ADD(i, j);
printf("%d", ret);
return 0;
}
这个宏接收参数 a和b以后 .预处理器就会将ADD(i+j)替换为i+j。
由于是直接替换,因此会存在一些问题:
比如在这个程序中4*ADD(i+j)会被直接替换为4*i+j,相比于函数传参,宏是直接完成替换,因此为了避免发生错误要加上括号:
#define ADD(a,b) ((a)+(b))
#define DOUBLE(x) ( (x) + (x) )
#define 替换规则:
- 在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。
- 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值替换。
- 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。
注意:
- 宏参数和#define 定义中可以出现其他#define定义的变量。但是对于宏,不能出现递归。
- 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索。
2.3#和##
#可以在宏定义中,把参数替换到字符串中:
#include<stdio.h>
#define PRINT(X) printf("the value of " #X " is %d\n", X)
int main()
{
int a = 10;
int b = 20;
PRINT(a);
PRINT(b);
return 0;
}
##可以将位于它两端的字符串合在一起
#include<stdio.h>
#define ADD_TO_SUM(num, value) sum##num += value;
int main()
{
int sum5 = 0;
ADD_TO_SUM(5, 10);
printf("%d", sum5);
return 0;
}
sum##num会被合并成sum5
2.4宏和函数对比
宏一般用于执行简单的运算。
相比于函数,宏有以下的优势:
- 函数的调用是有开销的。所以宏比函数在程序的规模和速度方面更胜一筹。
- 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于>来比较的类型。宏是类型无关的。
宏也有以下的劣势:
- 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。
- 宏是没法调试的。
- 宏由于类型无关,也就不够严谨。
- 宏可能会带来运算符优先级的问题,导致程容易出现错。
宏有时候可以做函数做不到的事情。比如:宏的参数可以出现类型,但是函数做不到。
#define MALLOC(num, type) (type *)malloc(num * sizeof(type))
//使用
MALLOC(10, int);//类型作为参数
//预处理器替换之后:
(int *)malloc(10 * sizeof(int));
为了将宏和函数进行区分:一般把宏名全部大写 ,函数名不要全部大写。
2.4.1利用宏计算结构体中某变量相对于首地址的偏移量
之前已经学过计算结构体中某变量相对于首地址的偏移量了:
#include<stdio.h>
struct S1
{
char c1;
int i;
char c2;
}s;
int main()
{
printf("%d\n", (char*)(&s.i) - (char*)(&s));
return 0;
}
这次模拟实现宏offsetof来计算这个偏移量:
#include<stdio.h>
#define OFFSETOF(struct_name, member_name) (int)&(((struct_name*)0)->member_name)
struct S
{
char c1;
int a;
char c2;
};
int main()
{
//struct S s;
printf("%d\n", OFFSETOF(struct S, c1));
printf("%d\n", OFFSETOF(struct S, a));
printf("%d\n", OFFSETOF(struct S, c2));
return 0;
}
这个宏将0地址强制转换成结构体指针然后找到对应的结构体成员,由于起始地址是0,因此取地址以后得到的是相对于起始位置的偏移量,这个偏移量是个地址,因此最好再转换成int型,当然不转也可以。
2.5#undef移除宏定义
这条指令用于移除一个宏定义。
2.6条件编译
条件编译可以实现如果一个宏有定义,那么其中的代码就会参与编译,否则则不会参与编译:
#include <stdio.h>
//#define __DEBUG__
int main()
{
int i = 0;
int arr[10] = { 0 };
for (i = 0; i < 10; i++)
{
arr[i] = i;
#ifdef __DEBUG__
printf("%d\n", arr[i]);//为了观察数组是否赋值成功。
#endif
}
return 0;
}
常见的条件编译指令:
#if 常量表达式
//...
#endif
//常量表达式由预处理器求值。
#define __DEBUG__ 1
#if __DEBUG__
//..
#endif
多个分支的条件编译:
#if 常量表达式
//...
#elif 常量表达式
//...
#else
//...
#endif
判断是否被定义
#if defined(symbol)
//如果symbol定义了,则中间的代码参与编译
#endif
#ifdef
//如果symbol定义了,则中间的代码参与编译
#endif
#if !defined(symbol)
//如果symbol没有定义,则中间的代码参与编译
#endif
#ifndef
//如果symbol没有定义,则中间的代码参与编译
#endif
嵌套指令(类似于if语句嵌套):
#if defined(OS_UNIX)
#ifdef OPTION1
unix_version_option1();
#endif
#ifdef OPTION2
unix_version_option2();
#endif
#elif defined(OS_MSDOS)
#ifdef OPTION2
msdos_version_option2();
#endif
#endif
2.7文件包含
#include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方一样。
这种替换的方式很简单: 预处理器先删除这条指令,并用包含文件的内容替换。 这样一个源文件被包含10次,那就实际被编译10次。
头文件被包含的方式
- 本地文件
#include "filename"
这种包含方式方式:编译器会先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件。 如果找不到就提示编译错误。
- 库文件
#include <filename.h>
查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。
因此本地文件的查找方式比库文件的查找范围更广,因此库文件也可以使用本地文件的查找方式,但是这样查找效率会非常低,如果代码量多,那么编译时间就会很长。
如果头文件被重复包含,那么头文件就会被重复编译,效率非常低,为了解决这种情况可以使用条件编译指令:
#ifndef __TEST_H__
#define __TEST_H__
//头文件的内容
#endif //__TEST_H__
或者
#pragma once
//头文件的内容
版权声明:本文为CSDN博主「精致的灰(>_<)」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_52670477/article/details/119114794
- 点赞
- 收藏
- 关注作者
评论(0)