Linux操作命令(六)

该节主要讲解wc,grep,正则表达式 命令。

这里对linux常用的命令进行整理,以便日后查看。
–来自实验楼。

##wc命令
wc命令是一个统计的工具,主要用来显示文件所包含的行、字和字节数。

wc命令是word count的缩写。

###命令格式:
wc [选项] [文件]

###常用参数:

  • -c 统计字节数
  • -l 统计行数
  • -m 统计字符数,这个标志不能与 -c 标志一起使用
  • -w 统计字数,一个字被定义为由空白、跳格或换行字符分隔的字符串
  • -L 打印最长行的长度

###常用范例:
例一:统计文件的字节数、行数、字符数,可以使用如下命令:

wc -c c.txt
wc -l c.txt
wc -m c.txt

img

注意每行结尾的换行符也算一个字符,空格也算一个字符。另外,由于系统采用UTF-8编码,所以一个汉字为3字节,9个汉字加上一个换行,一共28个字节。

例二:统计文件的字节数、行数、字符数,只打印数字,不打印文件名,可以使用如下命令:

cat c.txt | wc -c 
cat c.txt | wc -l 
cat c.txt | wc -m

img

例三:统计/bin目录下的命令个数,可以使用如下命令:

ls /bin | wc -l

##grep 命令
grep是个很强大的命令,用来找到文件中的匹配文本,并且能够接受正则表达式和通配符,同时可以用多个grep命令选项来生成各种格式的输出。

grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到标准输出,不影响原文件内容。

grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。

##命令格式:
grep [选项] pattern [file]

##常用参数:

  • -c 计算找到 '搜寻字符串'(即pattern) 的次数
  • -i 忽略大小写的不同,所以大小写视为相同
  • -n 输出行号
  • -v 反向选择,打印不匹配的行
  • -r 递归搜索
  • –color=auto 将找到的关键词部分加上颜色显示

###常用范例:
例一:将/etc/passwd文件中出现root的行取出来,关键词部分加上颜色显示,可以使用如下命令:

grep “root” /etc/passwd --color=auto
cat /etc/passwd | grep “root” --color=auto

img

例二:将/etc/passwd文件中没有出现root和nologin的行取出来,可以使用如下命令:

grep -v “root” /etc/passwd | grep -v “nologin”

img

例三:在当前目录下递归搜索文件中包含main()的文件,经常用于查找某些函数位于哪些源代码文件中,可以使用如下命令:

grep -r “main()” . 

img

##正则表达式与grep命令
正则表达式是一种符号表示法,被用来识别文本模式。在某种程度上,它们与匹配文件和路径名的 shell 通配符比较相似,但其规模更大。许多命令行工具和大多数的编程语言都支持正则表达式,以此来帮助解决文本操作问题。

正则表达式元字符由以下字符组成:

^ $ . [ ] { } - ? * + ( ) | \

img

###常用范例:
例一:利用Linux系统自带的字典查找一个五个字母的单词,第三个字母为j,最后一个字母为r ,/usr/share/dict目录下存放字典文件,可以使用如下命令:

grep ‘^..j.r$’ linux.words

img

例二:验证固定电话,打印符合条件的电话,固定电话格式基本都是带有0的区号+连接符“-”+电话号码,另外还有可能有分机号,区号有3位、4位,电话号码有7位和8位的,可以使用如下命令:

grep “^0[0-9]{2,3}-[0-9]{7,8}(-[0-9]{3,4})?$” telphone.txt

区号:前面一个0,后面跟2-3位数字 : 0[0-9]{2,3}

电话号码:7-8位数字: [0-9]{7,8}

分机号:一般都是3-4位数字: [0-9]{3,4}

img

注意执行下面的命令时没有任何匹配输出,这是因为没有加-E选项,那例一没加为什么可以呢,这是因为grep把.当成shell通配符,不是正则表达式的元字符。

img

Comments

2016-06-29