牛皮的awk命令

最新推荐文章于 2024-11-04 11:01:48 发布

weixin_30632883

最新推荐文章于 2024-11-04 11:01:48 发布

阅读量153

点赞数

原文链接：http://www.cnblogs.com/zrxuexi/p/11407374.html

版权

1、awk介绍【单独的编程语言解释器】
　　全称Aho Weinberger Kernaighan三个人的首字母缩写;
　　1970年第一次出现在Unix机器上，后来在开源领域使用它;
　　所以，我们在Linux中使用，改名为GNU awk;所以，在Linux 上实际上叫做gawk;
　　grep行过滤器
  　　　　参数：-o只显示匹配内容   -i忽略大小写    -v取反    -E使用扩展正则表达式
　　sed行编辑器
  　　　　参数：-n取消默认输出     p打印
  　　　　使用方式有：地址定界，正则表达
  　　　　命令：p     a       i       w        c         s
　　awk报告生成器
  　　　　通过模式匹配以及自己本身的语言格式，来获取、并输出客户所需要的内容；
  　　　　awk -F: '{if($3>=1&&$3< = 500){print $3}}' /etc/passwd
  　　　　# awk最后实现这个功能的时候只需要一句话就可以!
  　　　　格式化输出的意义:
  　　　　awk -F:-V OFS="." 'BEGIN{printf”username      udi         \n===================\n"{if($3>=18&$3<= 500){printf "用户名:%-10s UID:%-10d\n",$1,$3}END{printf"\------------------------------\nend\n"}' /etc/pass
2、awk工作原理
　　依次把匹配到的行使用awk工具进行编辑或者格式化打印输出，所以关于行的循环，在awk中，就可以不使用了
3、awk的用法
awk   参数...    ''    FILE..
　　1)program必须使用单引号
　　2）多条program语句使用大括号包含起来，可以并列，可以嵌套
  　　　　awk 'print' /etc/passwd
4、awk的常见参数
　　-F     指定分割符    还可以指定多个     awk -F[/:]
　　-v     因为awk是一种语言编译器，能自己定义变量们同事也有内置变量（与环境变量类似）
  　　　　而-v就是手动指定参数
  　　　　awk -v a =“a/b”'{print a}' a.txt    给a赋值，打印a这个变量
  　　　　1）a是自定义变量 -v FS":"
  　　　　2）在awk中调用自定义变量不用加$符号
  　　　　　　 awk '{a="a/b";print a}' a.txt
5、awk的语法格式 --program
　　1）print
　　　　默认输出（在屏幕上显示）
  　　　　在awk中没有保存命令，我们可以关联别的命令来保存结果
　　2）printf--实现格式化输出
  　　　　printf "%s是%d班的最好的学生"，变量1，变量2
  　　　　格式符：
  　　　　　　 %s
   　　　　　　%d %i   数值
   　　　　　　%e %E   科学计算数
   　　　　　　%c Acs值、
   　　　　　　%f浮点数
   　　　　　　%%逃逸符，只显示%自己
  　　　　　　 %u无符号整数
  　　　　修饰符：
  　　　　　　默认为右对齐
   　　　　　　- 代表左对齐
   　　　　　　%5.4f      5表示所占位数      4所取小数位
3）变量（内置变量、自定义变量）
  　　内置变量--环境变量（bash）查看环境变量命令（env 、set -C +C）
   　　　　　awk语言所默认支持的变量
   　　　　　FS 定义输入分隔符的变量
   　　　　　OFS定义输出分隔符的变量
   　　　　　NF     定义分割以后的参数个数（$NF 分隔以后最后一列变量）
   　　　　　NR 定义文件的行数，定义多个文件的文件的行号叠加
   　　　　　FNR 文件只计算自己的行号
   　　　　　　awk {print NR}' /etc/fstab /etc/passwd
   　　　　　　awk '{print FNR}' /etc/fstab /etc/passwd
   　　　　　　　　 FILENAME存储文件的名字
   　　　　　　awk '{print FILENAME}' /etc/passwd //把文件名打印N次， N文件的行数
   　　　　　　awk 'BEGIN{print FILENAME}' /etc/passwd //BEGIN的意思是只执行一次这个打印
    　　　　　　　　ARGC 整个命令的段数   【不包含program本身】
   　　　　　　awk 'BEGIN{print ARGC} /etc/passwd /etc/fstab /etc/shadow
    　　　　　　　　ARGV数组，来调取命令中，指定的段例如ARGV[2]
    　　　　　　　　RS   指定换行符     可以指定心的换行符，不影响本身的换行
    　　　　　　　　ORS   输出的时候指定换行符，将默认换行符替换为指定换行符
　　自定义变量
   　　　　-v 变量=值
    　　　　　　在后面的'program'中去调用自定义变量时4，直接使用即可
   　　　　　　或者将“变量=值”直接写在'program'里面
6、模式匹配（地址定界）
   　　　　　　1）空值，没有定义，默认就将文件中的所有的行，放入awk进行循环
   　　　　　　2）对固定的1，3行进行操作
   　　　　　　　　　　 awk '1,3{print}'      #注意awk默认不支持1-3 1，3等等
   　　　　　　　　　　 awk 'NR>=1&&NR<=3;{print}' /etc/passwd
   　　　　　　3）匹配
   　　　　　　　　　　 awk '/r..ter/{print}'   /etc/passwd
  　　　　　　 4）匹配模式可以直接使用判断语句
    　　　　　　　　　　awk -F: '$NF =="/bin/bash"{print $1,$3}' /etc/passwd
   　　　　　　5）BIGEIN|END语句
   　　　　　　BIGEIN定义在默认循环进行操作前要执行的语句
   　　　　　　　　　　awk -F: 'BEGIN{printf "shell程序为bash的用户为: \n"}$NF=="/bin/bash"{print $1,$3}' /etc/passwd
   　　　　　　　　　　awk -F: 'BEGIN{printf "shell程序为bash的用户为: \n"}$NF= = "/bin/bash"{print $1,$3}END{printf "end\n"}'
  　　　　　　　　　　一般在格式化输出的时候，打印表头和表末；
7、操作符　　　　
　　　　运算操作符：
  　　　　　　+ - * / % ** //
　　　　比较运算符：
　　　　　　 == ！=   > < >=    <=
　　　　　　  ~！~
  　　　　　　awk -F: '$NF~"/bin/bash" {print $1,$3}' /etc/passwd
  　　　　　　awk -F: '$NF!~ "/bin/bash"{print $1,$3}' /etc/passwd
　　　　逻辑操作符：
  　　　　　　&&
　　　　　　 ||
　　　　　　！
　　　　赋值操作符：
　　　　　　 = += -= /= *=
　　　　条件表达式：
  　　　　　　条件语句？条件成立语句
8、常见action
　　　　print printf 以及其他任何操作都是action
9、常见语言
　　1）if语句
  　　　　语法格式：if(条件表达式){执行语句}
   　　　　　　if(条件表达式){执行语句} else{执行语句}
   　　　　　　awk '/^title/{if(NF <= 2) {print}else {print 参数过少}}’ /boot/grub/grub.conf
  　　　　　　 awk '/title/{if(NF<=2) print $4}' /boot/grub/grub.conf
　　2）while语句
　　　　　　只有对行参数进行遍历的时候才会使用循环；
  　　　　　　语法格式：while （条件表达式）{循环体}
  　　　　　　awk /^[[:spacel]*kernel\> /{i= 1;while(i< = NF){printf $i"\t";print length($i);i+ + }}' grub.conf
　　3）for语句
　　　　　　语法格式：for(初始值;条件判断初始值控制语句){循环体}
　　　　　　awk '/^[[:space:]*kernel\> /{for(i=1; i<=NF; i++){printf $i"\t"; print length($)}} grub.conf
　　　　　　循环建议使用for语句
　　练习：统计一下啊某个文件中指定行中单词出现的次数；
  　　　　在awk中，for也可以使用shell中一样的格式：
  　　　　回顾：
   　　　　　　for i in 列表；do
    　　　　　　循环体
   　　　　　　done
  　　　　　　for（i in 列表）{循环体}
  　　　　　　echo "xia liang z shi k hen n shuai da fa le"|awk
　　　4）do-while循环
  　　　　　　语法：do {循环体}while（循环条件）
  　　　　　　注意和while的区别：while语句只有在满足条件的时候，才会进入循环，而do while会先执行一次循环体，再进行条件判断
　　5）循环跳出语句
  　　　　break [n] 跳出本次循环；
  　　　　continue 跳出本次循环；
  　　　　next 跳出默认的当前循环；
　　　　awk '{if(NR%2==1){next}else {print}}' /etc/passwd
　　6）switch类似于case
　　　　语法格式：　　　　
  　　　　 switch(表达式){case 模式匹配值；执行语句；case 模式匹配值；执行语句。。。，default ；执行语句}
10、数组
　　　　在awk中，数组和shell中的数组特性相同；
  　　　　　　注意：awk中数组不用定义，只要使用了，就有值为空的默认数组；这在做数据统计的时候非常常见
　　　　行遍历--->实际上就是整个文件的遍历
　　　　列遍历--->取对象固定某列的中的，相同数据的统计
　　　　　　注意：数组通过for语句，再给其他变量赋值的时候，赋值的是index索引信息
　　　　练习：统计一下某个文件中指定行中单词出现的次数；
　　　　　　awk -v RS=" " {print} a.txt | awk "{ls[$1]+ +}END{for(i in ls){print ls[[i]}}'
　　　　练习:统计-下一个文件中每个单词(以空格隔开的字符串)出现的次数;
　　　　　　awk '{for(i= 1;i< =NF;i+ +){count[$i]+ +}}END{for(i in count) {print i,count[i]}' /etc/fstab
　　　　　　 awk '{for(i= 1;i< =NF;+ +){ls[$i]+ + }END{for (j in Is){print j ,ls[j]}"' /var/log/httpd/access log | sort -t" " -k2 -nr
11、函数
　　1）内置函数
  　　　　　　函数的调用：funcation（参数）
  　　　　　　length（）统计字符串长度
  　　　　　　数学运算上使用的行数sin（）
  　　　　　　sub（x，x，x）替换第一个匹配到的值
   　　　　　　　　awk '{print sub(o,O,$1)}' /etc/passwd //将o替换为O文件中的第一列（匹配一个）
  　　　　　　gsub
   　　　　　　　　awk '{print gsub(o,O,$1)}' /etc/passwd将o替换为O文件中的第一列（全部匹配）
　　　　　　 split（x,x,x）指定分隔符去切割文件
   　　　　　　　　netstat -tan | awk '/^tcp\> /{split($5,ip,":");prin ip[1]}'
   　　　　　　　　netstat -tan | awk '/^tcp\> /{split($5,ip,":");counti[ip[1]]+ +}END{for (i in count) {print i,count[i]}}'
2）自定义变量