2. 自定义函数

我们不仅可以调用 C 标准库提供的函数，也可以定义自己的函数，事实上我们已经这么做了：我们定义了 main 函数。例如：

int main(void) {
    int hour = 11;
    int minute = 59;
    printf("%d and %d hours\n", hour, minute / 60);
    return 0;
}

main 函数的特殊之处在于执行程序时它自动被操作系统调用，操作系统就认准了 main 这个名字，除了名字特殊之外， main 函数和别的函数没有区别。我们对照着 main 函数的定义来看语法规则：

函数定义 → 返回值类型函数名 (参数列表) 函数体函数体 → { 语句列表 } 语句列表 → 语句列表项语句列表项 ... 语句列表项 → 语句语句列表项 → 变量声明、类型声明或非定义的函数声明非定义的函数声明 → 返回值类型函数名 (参数列表);

我们稍后再详细解释“函数定义”和“非定义的函数声明”的区别。从第 7 章结构体开始我们才会看到类型声明，所以现在暂不讨论。

给函数命名也要遵循上一章讲过的标识符命名规则。由于我们定义的 main 函数不带任何参数，参数列表应写成 void 。函数体可以由若干条语句和声明组成，C89 要求所有声明写在所有语句之前（本书的示例代码都遵循这一规定），而 C99 的新特性允许语句和声明按任意顺序排列，只要每个标识符都遵循先声明后使用的原则就行。 main 函数的返回值是 int 型的， return 0; 这个语句表示返回值是 0， main 函数的返回值是返回给操作系统看的，因为 main 函数是被操作系统调用的，通常程序执行成功就返回 0，在执行过程中出错就返回一个非零值。比如我们将 main 函数中的 return 语句改为 return 4; 再执行它，执行结束后可以在 Shell 中看到它的退出状态（Exit Status）：

bash

$ ./a.out
11 and 0 hours
$ echo $?
4

$? 是 Shell 中的一个特殊变量，表示上一条命令的退出状态。关于 main 函数需要注意两点：

K&R 书上的 main 函数定义写成 main(){...} 的形式，不写返回值类型也不写参数列表，这是 Old Style C 的风格。Old Style C 规定不写返回值类型就表示返回 int 型，不写参数列表就表示参数类型和个数没有明确指出。这种宽松的规定使编译器无法检查程序中可能存在的 Bug，增加了调试难度，不幸的是现在的 C 标准为了兼容旧的代码仍然保留了这种语法，但读者绝不应该继续使用这种语法。
其实操作系统在调用 main 函数时是传参数的， main 函数最标准的形式应该是 int main(int argc, char *argv[])，在第 6 节“指向指针的指针与指针数组” 详细介绍。C 标准也允许 int main(void) 这种写法，如果不使用系统传进来的两个参数也可以写成这种形式。但除了这两种形式之外，定义 main 函数的其它写法都是错误的或不可移植的。

关于返回值和 return 语句我们将在第 1 节“return 语句” 详细讨论，我们先从不带参数也没有返回值的函数开始学习定义和使用函数：

例 3.2. 最简单的自定义函数

#include <stdio.h>

void newline(void) {
    printf("\n");
}

int main(void) {
    printf("First Line.\n");
    newline();
    printf("Second Line.\n");
    return 0;
}

执行结果是：

bash

First Line.

Second Line.

我们定义了一个 newline 函数给 main 函数调用，它的作用是打印一个换行，所以执行结果中间多了一个空行。 newline 函数不仅不带参数，也没有返回值，返回值类型为 void 表示没有返回值 ^[1]，这说明我们调用这个函数完全是为了利用它的 Side Effect。如果我们想要多次插入空行就可以多次调用 newline 函数：

int main(void) {
    printf("First Line.\n");
    newline();
    newline();
    newline();
    printf("Second Line.\n");
    return 0;
}

如果我们总需要三个三个地插入空行，我们可以再定义一个 threeline 函数每次插入三个空行：

例 3.3. 较简单的自定义函数

#include <stdio.h>

void newline(void) {
    printf("\n");
}

void threeline(void) {
    newline();
    newline();
    newline();
}

int main(void) {
    printf("Three lines:\n");
    threeline();
    printf("Another three lines.\n");
    threeline();
    return 0;
}

通过这个简单的例子可以体会到：

同一个函数可以被多次调用。
可以用一个函数调用另一个函数，后者再去调第三个函数。
通过自定义函数可以给一组复杂的操作起一个简单的名字，例如 threeline。对于 main 函数来说，只需要通过 threeline 这个简单的名字来调用就行了，不必知道打印三个空行具体怎么做，所有的复杂操作都被隐藏在 threeline 这个名字后面。
使用自定义函数可以使代码更简洁， main 函数在任何地方想打印三个空行只需调用一个简单的 threeline() ，而不必每次都写三个 printf("\n")。

读代码和读文章不一样，按从上到下从左到右的顺序读代码未必是最好的。比如上面的例子，按源文件的顺序应该是先看 newline 再看 threeline 再看 main。如果你换一个角度，按代码的执行顺序来读也许会更好：首先执行的是 main 函数中的语句，在一条 printf 之后调用了 threeline，这时再去看 threeline 的定义，其中又调用了 newline，这时再去看 newline 的定义， newline 里面有一条 printf，执行完成后返回 threeline，这里还剩下两次 newline 调用，效果也都一样，执行完之后返回 main，接下来又是一条 printf 和一条 threeline。如下图所示：

图 3.1. 函数调用的执行顺序

函数调用的执行顺序

读代码的过程就是模仿计算机执行程序的过程，我们不仅要记住当前读到了哪一行代码，还要记住现在读的代码是被哪个函数调用的，这段代码返回后应该从上一个函数的什么地方接着往下读。

现在澄清一下函数声明、函数定义、函数原型（Prototype）这几个概念。比如 void threeline(void) 这一行，声明了一个函数的名字、参数类型和个数、返回值类型，这称为函数原型。在代码中可以单独写一个函数原型，后面加 ; 号结束，而不写函数体，例如：

void threeline(void);

这种写法只能叫函数声明而不能叫函数定义，只有带函数体的声明才叫定义。上一章讲过，只有分配存储空间的变量声明才叫变量定义，其实函数也是一样，编译器只有见到函数定义才会生成指令，而指令在程序运行时当然也要占存储空间。那么没有函数体的函数声明有什么用呢？它为编译器提供了有用的信息，编译器在翻译代码的过程中，只有见到函数原型（不管带不带函数体）之后才知道这个函数的名字、参数类型和返回值，这样碰到函数调用时才知道怎么生成相应的指令，所以函数原型必须出现在函数调用之前，这也是遵循“先声明后使用”的原则。

在上面的例子中， main 调用 threeline ， threeline 再调用 newline，要保证每个函数的原型出现在调用之前，就只能按先 newline 再 threeline 再 main 的顺序定义了。如果使用不带函数体的声明，则可以改变函数的定义顺序：

#include <stdio.h>

void newline(void);
void threeline(void);

int main(void) { ... }

void newline(void) { ... }

void threeline(void) { ... }

这样仍然遵循了先声明后使用的原则。

由于有 Old Style C 语法的存在，并非所有函数声明都包含完整的函数原型，例如 void threeline(); 这个声明并没有明确指出参数类型和个数，所以不算函数原型，这个声明提供给编译器的信息只有函数名和返回值类型。如果在这样的声明之后调用函数，编译器不知道参数的类型和个数，就不会做语法检查，所以很容易引入 Bug。读者需要了解这个知识点以便维护别人用 Old Style C 风格写的代码，但绝不应该按这种风格写新的代码。

如果在调用函数之前没有声明会怎么样呢？有的读者也许碰到过这种情况，我可以解释一下，但绝不推荐这种写法。比如按上面的顺序定义这三个函数，但是把开头的两行声明去掉：

#include <stdio.h>

int main(void) {
    printf("Three lines:\n");
    threeline();
    printf("Another three lines.\n");
    threeline();
    return 0;
}

void newline(void) {
    printf("\n");
}

void threeline(void) {
    newline();
    newline();
    newline();
}

编译时会报警告：

bash

$ gcc main.c
main.c:17: warning: conflicting types for ‘threeline’
main.c:6: warning: previous implicit declaration of ‘threeline’ was here

但仍然能编译通过，运行结果也对。这里涉及到的规则称为函数的隐式声明（Implicit Declaration），在 main 函数中调用 threeline 时并没有声明它，编译器认为此处隐式声明了 int threeline(void);，隐式声明的函数返回值类型都是 int ，由于我们调用这个函数时没有传任何参数，所以编译器认为这个隐式声明的参数类型是 void，这样函数的参数和返回值类型都确定下来了，编译器根据这些信息为函数调用生成相应的指令。然后编译器接着往下看，看到 threeline 函数的原型是 void threeline(void)，和先前的隐式声明的返回值类型不符，所以报警告。好在我们也没用到这个函数的返回值，所以执行结果仍然正确。

敏锐的读者可能会发现一个矛盾：如果函数 newline 没有返回值，那么表达式 newline() 不就没有值了吗？然而上一章讲过任何表达式都有值和类型两个基本属性。其实这正是设计 void 这么一个关键字的原因：首先从语法上规定没有返回值的函数调用表达式有一个 void 类型的值，这样任何表达式都有值，不必考虑特殊情况，编译器的语法解析比较容易实现；然后从语义上规定 void 类型的表达式不能参与运算，因此 newline() + 1 这样的表达式不能通过语义检查，从而兼顾了语法上的一致和语义上的不矛盾。 ↩︎

第 1 章程序的基本概念

第 2 章常量、变量和表达式

第 3 章简单函数

第 4 章分支语句

第 5 章深入理解函数

第 6 章循环语句

第 7 章结构体

第 8 章数组

第 9 章编码风格

第 10 章 gdb

第 11 章排序与查找

第 12 章栈与队列

第 14 章计算机中数的表示

第 15 章数据类型详解

第 16 章运算符详解

第 17 章计算机体系结构基础

第 18 章 x86 汇编程序基础

第 19 章汇编与 C 之间的关系

第 20 章链接详解

第 21 章预处理

第 22 章 Makefile 基础

第 23 章指针

第 24 章函数接口

第 25 章 C 标准库

第 26 章链表、二叉树和哈希表

第 28 章文件与 I/O

第 29 章文件系统

第 30 章进程

第 31 章 Shell 脚本

第 32 章正则表达式

第 33 章信号

第 34 章终端、作业控制与守护进程

第 35 章线程

第 36 章 TCP/IP 协议基础

第 37 章 socket 编程

2. 自定义函数

2. 自定义函数 ​

2. 自定义函数