1、awk介绍【单独的编程语言解释器】
全称Aho Weinberger Kernaighan三个人的首字母缩写;
1970年第一次出现在Unix机器上,后来在开源领域使用它;
所以,我们在Linux中使用,改名为GNU awk;所以,在Linux 上实际上叫做gawk;
grep行过滤器
参数:-o只显示匹配内容 -i忽略大小写 -v取反 -E使用扩展正则表达式
sed行编辑器
参数:-n取消默认输出 p打印
使用方式有:地址定界,正则表达
命令:p a i w c s
awk报告生成器
通过模式匹配以及自己本身的语言格式,来获取、并输出客户所需要的内容;
awk -F: '{if($3>=1&&$3< = 500){print $3}}' /etc/passwd
# awk最后实现这个功能的时候只需要一句话就可以!
格式化输出的意义:
awk -F:-V OFS="." 'BEGIN{printf”username udi \n===================\n"{if($3>=18&$3<= 500){printf "用户名:%-10s UID:%-10d\n",$1,$3}END{printf"\------------------------------\nend\n"}' /etc/pass
2、awk工作原理
依次把匹配到的行使用awk工具进行编辑或者格式化打印输出,所以关于行的循环,在awk中,就可以不使用了
3、awk的用法
awk 参数... '' FILE..
1)program必须使用单引号
2)多条program语句使用大括号包含起来,可以并列,可以嵌套
awk 'print' /etc/passwd
4、awk的常见参数
-F 指定分割符 还可以指定多个 awk -F[/:]
-v 因为awk是一种语言编译器,能自己定义变量们同事也有内置变量(与环境变量类似)
而-v就是手动指定参数
awk -v a =“a/b”'{print a}' a.txt 给a赋值,打印a这个变量
1)a是自定义变量 -v FS":"
2)在awk中调用自定义变量不用加$符号
awk '{a="a/b";print a}' a.txt
5、awk的语法格式 --program
1)print
默认输出 (在屏幕上显示)
在awk中没有保存命令,我们可以关联别的命令来保存结果
2)printf--实现格式化输出
printf "%s是%d班的最好的学生",变量1,变量2
格式符:
%s
%d %i 数值
%e %E 科学计算数
%c Acs值、
%f浮点数
%%逃逸符,只显示%自己
%u无符号整数
修饰符:
默认为右对齐
- 代表左对齐
%5.4f 5表示所占位数 4所取小数位
3)变量(内置变量、自定义变量)
内置变量--环境变量(bash)查看环境变量命令(env 、set -C +C)
awk语言所默认支持的变量
FS 定义输入分隔符的变量
OFS定义输出分隔符的变量
NF 定义分割以后的参数个数($NF 分隔以后最后一列变量)
NR 定义文件的行数,定义多个文件的文件的行号叠加
FNR 文件只计算自己的行号
awk {print NR}' /etc/fstab /etc/passwd
awk '{print FNR}' /etc/fstab /etc/passwd
FILENAME存储文件的名字
awk '{print FILENAME}' /etc/passwd //把文件名打印N次, N文件的行数
awk 'BEGIN{print FILENAME}' /etc/passwd //BEGIN的意思是只执行一次这个打印
ARGC 整个命令的段数 【不包含program本身】
awk 'BEGIN{print ARGC} /etc/passwd /etc/fstab /etc/shadow
ARGV数组,来调取命令中,指定的段例如ARGV[2]
RS 指定换行符 可以指定心的换行符,不影响本身的换行
ORS 输出的时候指定换行符,将默认换行符替换为指定换行符
自定义变量
-v 变量=值
在后面的'program'中去调用自定义变量时4,直接使用即可
或者将“变量=值”直接写在'program'里面
6、模式匹配(地址定界)
1)空值,没有定义,默认就将文件中的所有的行,放入awk进行循环
2)对固定的1,3行进行操作
awk '1,3{print}' #注意awk默认不支持1-3 1,3等等
awk 'NR>=1&&NR<=3;{print}' /etc/passwd
3)匹配
awk '/r..ter/{print}' /etc/passwd
4)匹配模式可以直接使用判断语句
awk -F: '$NF =="/bin/bash"{print $1,$3}' /etc/passwd
5)BIGEIN|END语句
BIGEIN定义在默认循环进行操作前要执行的语句
awk -F: 'BEGIN{printf "shell程序为bash的用户为: \n"}$NF=="/bin/bash"{print $1,$3}' /etc/passwd
awk -F: 'BEGIN{printf "shell程序为bash的用户为: \n"}$NF= = "/bin/bash"{print $1,$3}END{printf "end\n"}'
一般在格式化输出的时候,打印表头和表末;
7、操作符
运算操作符:
+ - * / % ** //
比较运算符:
== != > < >= <=
~!~
awk -F: '$NF~"/bin/bash" {print $1,$3}' /etc/passwd
awk -F: '$NF!~ "/bin/bash"{print $1,$3}' /etc/passwd
逻辑操作符:
&&
||
!
赋值操作符:
= += -= /= *=
条件表达式:
条件语句?条件成立语句
8、常见action
print printf 以及其他任何操作都是action
9、常见语言
1)if语句
语法格式:if(条件表达式){执行语句}
if(条件表达式){执行语句} else{执行语句}
awk '/^title/{if(NF <= 2) {print}else {print 参数过少}}’ /boot/grub/grub.conf
awk '/title/{if(NF<=2) print $4}' /boot/grub/grub.conf
2)while语句
只有对行参数进行遍历的时候才会使用循环;
语法格式:while (条件表达式){循环体}
awk /^[[:spacel]*kernel\> /{i= 1;while(i< = NF){printf $i"\t";print length($i);i+ + }}' grub.conf
3)for语句
语法格式:for(初始值;条件判断初始值控制语句){循环体}
awk '/^[[:space:]*kernel\> /{for(i=1; i<=NF; i++){printf $i"\t"; print length($)}} grub.conf
循环建议使用for语句
练习:统计一下啊某个文件中指定行中单词出现的次数;
在awk中,for也可以使用shell中一样的格式:
回顾:
for i in 列表;do
循环体
done
for(i in 列表){循环体}
echo "xia liang z shi k hen n shuai da fa le"|awk
4)do-while循环
语法:do {循环体}while(循环条件)
注意和while的区别:while语句只有在满足条件的时候,才会进入循环,而do while会先执行一次循环体,再进行条件判断
5)循环跳出语句
break [n] 跳出本次循环;
continue 跳出本次循环;
next 跳出默认的当前循环;
awk '{if(NR%2==1){next}else {print}}' /etc/passwd
6)switch类似于case
语法格式:
switch(表达式){case 模式匹配值;执行语句;case 模式匹配值;执行语句。。。,default ;执行语句}
10、数组
在awk中,数组和shell中的数组特性相同;
注意:awk中数组不用定义,只要使用了,就有值为空的默认数组;这在做数据统计的时候非常常见
行遍历--->实际上就是整个文件的遍历
列遍历--->取对象固定某列的中的,相同数据的统计
注意:数组通过for语句,再给其他变量赋值的时候,赋值的是index索引信息
练习:统计一下某个文件中指定行中单词出现的次数;
awk -v RS=" " {print} a.txt | awk "{ls[$1]+ +}END{for(i in ls){print ls[[i]}}'
练习:统计-下一个文件中每个单词(以空格隔开的字符串)出现的次数;
awk '{for(i= 1;i< =NF;i+ +){count[$i]+ +}}END{for(i in count) {print i,count[i]}' /etc/fstab
awk '{for(i= 1;i< =NF;+ +){ls[$i]+ + }END{for (j in Is){print j ,ls[j]}"' /var/log/httpd/access log | sort -t" " -k2 -nr
11、函数
1)内置函数
函数的调用:funcation(参数)
length()统计字符串长度
数学运算上使用的行数sin()
sub(x,x,x)替换第一个匹配到的值
awk '{print sub(o,O,$1)}' /etc/passwd //将o替换为O文件中的第一列(匹配一个)
gsub
awk '{print gsub(o,O,$1)}' /etc/passwd将o替换为O文件中的第一列(全部匹配)
split(x,x,x)指定分隔符去切割文件
netstat -tan | awk '/^tcp\> /{split($5,ip,":");prin ip[1]}'
netstat -tan | awk '/^tcp\> /{split($5,ip,":");counti[ip[1]]+ +}END{for (i in count) {print i,count[i]}}'
2)自定义变量