4. awk

sed 以行为单位处理文件， awk 比 sed 强的地方在于不仅能以行为单位还能以列为单位处理文件。 awk 缺省的行分隔符是换行，缺省的列分隔符是连续的空格和 Tab，但是行分隔符和列分隔符都可以自定义，比如 /etc/passwd 文件的每一行有若干个字段，字段之间以 : 分隔，就可以重新定义 awk 的列分隔符为 : 并以列为单位处理这个文件。 awk 实际上是一门很复杂的脚本语言，还有像 C 语言一样的分支和循环结构，但是基本用法和 sed 类似， awk 命令行的基本形式为：

bash

awk option 'script' file1 file2 ...
awk option -f scriptfile file1 file2 ...

和 sed 一样， awk 处理的文件既可以由标准输入重定向得到，也可以当命令行参数传入，编辑命令可以直接当命令行参数传入，也可以用 -f 参数指定一个脚本文件，编辑命令的格式为：

bash

/pattern/{actions}
condition{actions}

和 sed 类似， pattern 是正则表达式， actions 是一系列操作。 awk 程序一行一行读出待处理文件，如果某一行与 pattern 匹配，或者满足 condition 条件，则执行相应的 actions ，如果一条 awk 命令只有 actions 部分，则 actions 作用于待处理文件的每一行。比如文件 testfile 的内容表示某商店的库存量：

bash

ProductA  30
ProductB  76
ProductC  55

打印每一行的第二列：

bash

$ awk '{print $2;}' testfile
30
76
55

自动变量 $1 、 $2 分别表示第一列、第二列等，类似于 Shell 脚本的位置参数，而 $0 表示整个当前行。再比如，如果某种产品的库存量低于 75 则在行末标注需要订货：

bash

$ awk '$2<75 {printf "%s\t%s\n", $0, "REORDER";} $2>=75 {print $0;}' testfile
ProductA  30    REORDER
ProductB  76
ProductC  55    REORDER

可见 awk 也有和 C 语言非常相似的 printf 函数。 awk 命令的 condition 部分还可以是两个特殊的 condition － BEGIN 和 END ，对于每个待处理文件， BEGIN 后面的 actions 在处理整个文件之前执行一次， END 后面的 actions 在整个文件处理完之后执行一次。

awk 命令可以像 C 语言一样使用变量（但不需要定义变量），比如统计一个文件中的空行数

bash

$ awk '/^ *$/ {x=x+1;} END {print x;}' testfile

就像 Shell 的环境变量一样，有些 awk 变量是预定义的有特殊含义的：

表 32.6. awk 常用的内建变量

变量名	含义
`FILENAME`	当前输入文件的文件名，该变量是只读的
`NR`	当前行的行号，该变量是只读的， `R` 代表 record
`NF`	当前行所拥有的列数，该变量是只读的， `F` 代表 field
`OFS`	输出格式的列分隔符，缺省是空格
`FS`	输入文件的列分融符，缺省是连续的空格和 Tab
`ORS`	输出格式的行分隔符，缺省是换行符
`RS`	输入文件的行分隔符，缺省是换行符

例如打印系统中的用户帐号列表

bash

$ awk 'BEGIN {FS=":"} {print $1;}' /etc/passwd

awk 还可以像 C 语言一样使用 if / else 、 while 、 for 控制结构，此处从略。

第 1 章程序的基本概念

第 2 章常量、变量和表达式

第 3 章简单函数

第 4 章分支语句

第 5 章深入理解函数

第 6 章循环语句

第 7 章结构体

第 8 章数组

第 9 章编码风格

第 10 章 gdb

第 11 章排序与查找

第 12 章栈与队列

第 14 章计算机中数的表示

第 15 章数据类型详解

第 16 章运算符详解

第 17 章计算机体系结构基础

第 18 章 x86 汇编程序基础

第 19 章汇编与 C 之间的关系

第 20 章链接详解

第 21 章预处理

第 22 章 Makefile 基础

第 23 章指针

第 24 章函数接口

第 25 章 C 标准库

第 26 章链表、二叉树和哈希表

第 28 章文件与 I/O

第 29 章文件系统

第 30 章进程

第 31 章 Shell 脚本

第 32 章正则表达式

第 33 章信号

第 34 章终端、作业控制与守护进程

第 35 章线程

第 36 章 TCP/IP 协议基础

第 37 章 socket 编程

4. awk

4. awk ​

4. awk