C语言的程序环境及其预处理

阅读：评论：0

C语言的程序环境及其预处理

✅<1>主页：C语言的前男友
📃<2>知识讲解：C语言的程序环境及其预处理
🔥<3>创作者：C语言的前男友
☂️<4>开发环境：Visual Studio 2022
🏡<5>系统环境：Windows 10
💬<6>前言：我们在比较熟悉C语言语法的情况下再来学习一下，C语言的程序环境及其预处理，让我们对C语言的理解更加深入。

🍍一.程序的翻译环境和执行环境

🌽 二.详解编译+链接

🍉（1）编译和链接图解：

🍉（2）编译本身也分为几个阶段：

🍉1.预处理：

🍉2.编译：

🍉3.汇编

🍉4.链接

🏡三.预处理详解

🍒(1)预定义符号

🍒 (2)#define

🍚 1.#define定义的标识符

🍚 2.提问？

🍚 3.#define定义的宏

🍚 4.#define 替换规则

🍒（3） #和##

🍊1.#的作用

🍊2. ## 的作用

🍒（4）带副作用的宏参数

🍒（5）宏和函数对比

🍒（6）命名约定

🍒（7）#undef

🍉 四.条件编译

🍐五.文件包含

🍊(1) 头文件被包含的方式：

🍓六.嵌套文件包含

🏡最后：

梅须逊雪三分白，雪却输梅一段香。

🍍一.程序的翻译环境和执行环境

在ANSI C的任何一种实现中，存在两个不同的环境:

第1种是翻译环境	在这个环境中源代码被转换为可执行的机器指令。
第2种是执行环境	它用于实际执行代码。

在翻译环境中又可以细分：

🌽 二.详解编译+链接

🍉（1）编译和链接图解：

>组成一个程序的每个源文件通过编译过程分别转换成目标代码（object code）。

>每个目标文件由链接器（linker）捆绑在一起，形成一个单一而完整的可执行程序。

>链接器同时也会引入标准C函数库中任何被该程序所用到的函数，而且它可以搜索程序员个人的程序库，将其需要的函数也链接到程序中

我们常用的VS 2022 就是一个集成开发环境（IDE）：集成了编辑器，编译器，链接器，调试器。

🍉（2）编译本身也分为几个阶段：

🍉1.预处理：

这里用linux环境，和gcc编译环境展示。

这我们用linux下创建一个test.c的文件。

经过预处理完成之后就停下来，预处理之后产生的结果都放在test.i文件中：

gcc -E test.c -o test.i

我们发现原本只有几行的代码，经过预处理以后，变成了几百行了，代码里的注释也没有了。

这是因为在预处理时会发生：

1.头文件的包含，#include

2.注释的删除

3.#definde符号的替换

主要是一些文本的操作。

🍉2.编译：

编译时我们使用：

gcc -S test.i

生成 test.s 。

不难发现，这里的生成的 test.s 我们已经看不懂了，没错这里的就已经是汇编代码了。

而整个编译所做的事情有：

1.语法分析

2.此法分析

3.语义分析

4.符号汇总

最终把C语言的代码转换成汇编代码。

🍉3.汇编

我们通过命令：

gcc -c test.s

生成 test.o 的目标文件。

这里的 test.o 就更看不懂了，这里的 test.o 就是一个二进制文件了。

这里的汇编主要时通过：

1.将汇编指令，转换成二进制指令。

2.利用之前的符号汇总，生成符号汇总表。

🍉4.链接

我们通过命令：

gcc test.o -o test

生成一个可执行文件 test。

我们使用：

./test

执行我们的 test 文件。就可以得到我们的代码执行结果了。

在链接期间主要是：

1.合并汇编期间产生的段表

2.符号表的合并和重定位

总体：

🏡三.预处理详解

🍒(1)预定义符号

__FILE__         进行编译的源文件
__LINE__         文件当前的行号
__DATE__        文件被编译的日期
__TIME__         文件被编译的时间
__STDC__    如果编译器遵循ANSI C，其值为1，否则未定义

这些预定义符号都是语言内置的。
举个栗子：

#include<stdio.h>
int main()
{printf("file:%s line:%dn", __FILE__, __LINE__);return 0;
}

🍒 (2)#define

🍚 1.#define定义的标识符

语法：

#define name stuff

举个栗子：

#include<stdio.h>
#define MAX 1000
#define reg register      //为 register这个关键字，创建一个简短的名字
#define do_forever for(;;)   //用更形象的符号来替换一种实现
#define CASE break;case     //在写case语句的时候自动把 break写上。// 如果定义的 stuff过长，可以分成几行写，除了最后一行外，每行的后面都加一个反斜杠(续行符)。
#define DEBUG printf("file:%stline:%dt date:%sttime:%sn" ,__FILE__,__LINE__ ,__DATE__,__TIME__ )#define DEBUG_PRINT printf("%st %dt %st %sn", __FILE__, __LINE__, __DATE__, __TIME__)
int main()
{int a = MAX;DEBUG;DEBUG_PRINT;return 0;
}

🍚 2.提问？

在define定义标识符的时候，要不要在最后加上分号( ；)?

看一段代码：

#include<stdio.h>#define MAX 1000;int main()
{int max = 0;if (5>1)max = MAX;elsemax = 0;return 0;
}

因为：#define MAX 1000；

相当于在 if 的后面跟了两个语句，其中一个是空语句。

如果 if 的后面有两个语句的话，我们要给 if 加一个大括号才可以。

这就说明了：不建议在 #define 定义的标识符后面加上分号（；）。极易发生语法错误。

🍚 3.#define定义的宏

#define 机制包括了一个规定，允许把参数替换到文本中，这种实现通常称为宏（macro）或定义宏（define macro）。

下面是宏的申明方式：

#define name( parament-list ) stuff

其中的 parament-list 是一个由逗号隔开的符号表，它们可能出现在stuff中。

注意：

参数列表的左括号必须与name紧邻。
如果两者之间有任何空白存在，参数列表就会被解释为stuff的一部分。

警告：
这个宏存在一个问题：
观察下面的代码段：

#include<stdio.h>
#define ADDONE( x ) x*x
int main()
{int a = 5;int n = ADDONE(a+1);printf("%d", n);return 0;
}

乍一看，你可能觉得这段代码将打印36这个值。事实上，它将打印11.为什么？

因为：

替换文本时，参数x被替换成a + 1,所以这条语句实际上变成了：
printf (" %d n ",a + 1 * a + 1 );

这样就比较清晰了，由替换产生的表达式并没有按照预想的次序进行求值。
在宏定义上加上两个括号，这个问题便轻松的解决了：

#define SQUARE(x) (x) * (x)

这样预处理之后就产生了预期的效果：

printf ("%dn",(a + 1) * (a + 1) );

这里还有一个宏定义：

#define DOUBLE(x) (x) + (x)

定义中我们使用了括号，想避免之前的问题，但是这个宏可能会出现新的错误。

int a = 5;
printf("%dn" ,10 * DOUBLE(a));

这将打印什么值呢？
warning：
看上去，好像打印100，但事实上打印的是55.。我们发现替换之后：

printf ("%dn",10 * (5) + (5));

乘法运算先于宏定义的加法，所以出现了 55 .

这个问题，的解决办法是在宏定义表达式两边加上一对括号就可以了：

#define DOUBLE( x)  ( ( x ) + ( x ) )

提示：

所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号，避免在使用宏时由于参数中的操作符或邻近操作符之间不可预料的相互作用。

🍚 4.#define 替换规则

在程序中扩展#define定义符号和宏时，需要涉及几个步骤。

1. 在调用宏时，首先对参数进行检查，看看是否包含任何由#define定义的符号。如果是，它们首先
被替换。
2. 替换文本随后被插入到程序中原来文本的位置。对于宏，参数名被他们的值所替换。
3. 最后，再次对结果文件进行扫描，看看它是否包含任何由#define定义的符号。如果是，就重复上述处理过程。

注意：

1. 宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏，不能出现递归。
2. 当预处理器搜索#define定义的符号的时候，字符串常量的内容并不被搜索。

🍒（3） #和##

🍊1.# 的作用

如何把参数插入到字符串中？

首先我们看看这样的代码：

#include<stdio.h>int main()
{char* p = "hello ""bitn";printf("hello"" bitn");printf("%s", p);return 0;
}

我们发现字符串是有自动连接的特点的。

那我们是不是就可以这样写代码：

#define PRINT(FORMAT, VALUE) printf("the value is "FORMAT"n", VALUE);#include<stdio.h>int main()
{int p = 10;PRINT("%d", p);return 0;
}

如果我们想将打印出 the p is 10；我们可以把字符串"p"作为宏参数传递过去。

另一种方法就是，使用 # ，把一个宏参数变成对应的字符串。

#define PRINT(FORMAT, VALUE) printf("the " #VALUE " is "FORMAT"n", VALUE);#include<stdio.h>int main()
{int p = 10;PRINT("%d", p);return 0;
}

🍊2. ## 的作用

##可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。

#define ADD_TO_SUM(num, value) sum##num += value;
int main()
{int sum5 = 10;ADD_TO_SUM(5, 10);//作用是：给sum5增加10.printf("%dn", sum5);return 0;
}

注：
这样的连接必须产生一个合法的标识符。否则其结果就是未定义的。

🍒（4）带副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候，如果参数带有副作用，那么你在使用这个宏的时候就可能出现危险，导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。
例如：

x+1;//不带副作用
x++;//带有副作用

MAX宏可以证明具有副作用的参数所引起的问题。

#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
int main()
{int x = 5;int y = 8;int z = MAX(x++, y++);printf("x=%d y=%d z=%dn", x, y, z);//输出的结果是什么？
}

🍒（5）宏和函数对比

宏通常被应用于执行简单的运算。比如在两个数中找出较大的一个。

#define MAX(a, b) ((a)>(b)?(a):(b))

那为什么不用函数来完成这个任务？

原因有二：

1. 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。
所以宏比函数在程序的规模和速度方面更胜一筹。
2. 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于>来比较的类型。宏是类型无关的。

宏的缺点：（当然和函数相比宏也有劣势的地方）

1. 每次使用宏的时候，一份宏定义的代码将插入到程序中。除非宏比较短，否则可能大幅度增加程序的长度。
2. 宏是没法调试的

3. 宏由于类型无关，也就不够严谨。
4. 宏可能会带来运算符优先级的问题，导致程容易出现错。

宏有时候可以做函数做不到的事情。比如：宏的参数可以出现类型，但是函数做不到。

#define MALLOC(num, type) (type *)malloc(num * sizeof(type))
int main()
{//使用MALLOC(10, int);//类型作为参数//预处理器替换之后：(int*)malloc(10 * sizeof(int));
}

宏和函数的一个对比：

属性	#define定义宏	函数
代码长度	每次使用时，宏代码都会被插入到程序中。除了非常小的宏之外，程序的长度会大幅度增长	函数代码只出现于一个地方；每次使用这个函数时，都调用那个地方的同一份代码
执行速度	更快	存在函数的调用和返回的额外开销，所以相对慢一些
操作符优先级	宏参数的求值是在所有周围表达式的上下文环境里，除非加上括号，否则邻近操作符的优先级可能会产生不可预料的后果，所以建议宏在书写的时候多些括号	函数参数只在函数调用的时候求值一次，它的结果值传递给函数。表达式的求值结果更容易预测。
带有副作用的参数	参数可能被替换到宏体中的多个位置，所以带有副作用的参数求值可能会产生不可预料的结果	函数参数只在传参的时候求值一次，结果更容易控制。
参数类型	宏的参数与类型无关，只要对参数的操作是合法的，它就可以使用于任何参数类型	函数的参数是与类型有关的，如果参数的类型不同，就需要不同的函数，即使他们执行的任务是相同的
调试	宏是不方便调试的	函数是可以逐语句调试的
递归	宏是不能递归的	函数是可以递归的

🍒（6）命名约定

一般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者。
那我们平时的一个习惯是：

把宏名全部大写
函数名不要全部大写

🍒（7）#undef

#undef
//如果现存的一个名字需要被重新定义，那么它的旧名字首先要被移除。

这条指令用于移除一个宏定义。

🍉 四.条件编译

在编译一个程序的时候我们如果要将一条语句（一组语句）编译或者放弃是很方便的。因为我们有条件编译指令。

比如说：

调试性的代码，删除可惜，保留又碍事，所以我们可以选择性的编译。

代码：

#include <stdio.h>
#define __DEBUG__
int main()
{int i = 0;int arr[10] = { 0 };for (i = 0; i < 10; i++){arr[i] = i;
#ifdef __DEBUG__printf("%dn", arr[i]);//为了观察数组是否赋值成功。
#endif //__DEBUG__}return 0;
}

#include <stdio.h>
//#define __DEBUG__
int main()
{int i = 0;int arr[10] = { 0 };for (i = 0; i < 10; i++){arr[i] = i;
#ifdef __DEBUG__printf("%dn", arr[i]);//为了观察数组是否赋值成功。
#endif //__DEBUG__}return 0;
}

常见的条件编译指令：

1.
#if 常量表达式
//...
#endif
//常量表达式由预处理器求值。
如：
#define __DEBUG__ 1
#if __DEBUG__
//..
#endif
2.多个分支的条件编译
#if 常量表达式
//...
#elif 常量表达式
//...
#else
//...
#endif
3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
4.嵌套指令
#if defined(OS_UNIX)
#ifdef OPTION1
unix_version_option1();
#endif
#ifdef OPTION2
unix_version_option2();
#endif
#elif defined(OS_MSDOS)
#ifdef OPTION2
msdos_version_option2();
#endif
#endif

🍐五.文件包含

我们已经知道， #include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方一样。

这种替换的方式很简单：
预处理器先删除这条指令，并用包含文件的内容替换。
这样一个源文件被包含10次，那就实际被编译10次。

🍊(1) 头文件被包含的方式：

本地文件包含 :

#include "filename"

查找策略：先在源文件所在目录下查找，如果该头文件未找到，编译器就像查找库函数头文件一样在标准位置查找头文件。如果找不到就提示编译错误。

库文件包含:

#include <filename.h>

查找头文件直接去标准路径下去查找，如果找不到就提示编译错误。
这样是不是可以说，对于库文件也可以使用 “” 的形式包含？
答案是肯定的，可以。
但是这样做查找的效率就低些，当然这样也不容易区分是库文件还是本地文件了。

🍓六.嵌套文件包含

comm.h和comm.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。
这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复。

如何解决这个问题？

答案：条件编译。

#ifndef __TEST_H__
#define __TEST_H__
//头文件的内容
#endif  //__TEST_H__

或者：

#pragma once

就可以避免头文件的重复引入。

🏡最后：

梅须逊雪三分白，雪却输梅一段香。

本文发布于:2024-01-28 16:35:06，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/17064309118767.html

上一篇：linux文件打开过程分析

下一篇：java学习笔记

标签：语言环境程序

留言与评论（共有 0 条评论）

C语言的程序环境及其预处理