2004-11-10
基本元字符集及其含义
^ 只只匹配行首
$ 只只匹配行尾
* 只一个单字符后紧跟*,匹配0个或多个此单字符
[ ] 只匹配[ ]内字符。能够是个单字符,也能够是字符序列。能够使用-
表示[ ]内字符序列范围,如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
\ 只用来屏蔽一个元字符的特别含义。因为有时在s h e l l中一些元字符有
特别含义。\能够使其失去应有意义
. 只匹配任意单字符
p a t t e r n \ { n \ } 只用来匹配前面p a t t e r n出现次数。n为次数
p a t t e r n \ { n,\ } m 只含义同上,但次数最少为n
p a t t e r n \ { n,m \ } 只含义同上,但p a t t e r n出现次数在n和m之间


例:
#######
. 的情况

1。 ....xc....
假定正在过滤一个文本文档,对于一个有1 0个字符的脚本集,需要前4个字符之后为X C,


注意表达文档名时用单个?,而“.”用在正则里
ls -l ?bc
ls -l |grep ".bc"

#######
^ 只匹配行首
2。 ^...1
在行首第4个字符为1,

#######
$
3.trouble$
假定要匹配以
单词t r o u b l e结尾的任何行

#######
4.只返回包含一个字符的行
^.$

^youhongyu$只返回 只包含youhongyu的行

#######
使用\屏蔽一个特别字符的含义

$ . ' " [] ^ | ( ) \ ?


5.\*\.pas
假如要在正则表达式中匹配以* . p a s结尾的任何文档

######
[]

例:
假定要匹配任意一个数字,能够使用:
[ 0 1 2 3 4 5 6 7 8 9 ]
然而,通过使用“-”符号能够简化操作:
[ 0 - 9 ]
或任意小写字母
[ a - z ]
要匹配任意字母,则使用:
[ A - Z a - z ]
表明从A - Z、a - z的字母范围。
如要匹配任意字母或数字,模式如下:
[ A - Z a - z 0 - 9 ]
在字符序列结合使用中,能够用[ ]指出字符范围。假定要匹配一单词,以s开头,中间有
一任意字母,以t结尾,那么操作如下:
s[a-z A-Z]t


注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容
[^0-9]
匹配任一非字母字符
不在括号里是 只字首

################
使用\匹配模式结果出现的次数

操作如下:
匹配字母A出现两次,并以B结尾
A \ { 2 \ } B
匹配值为A A B
匹配A至少4次,使用:
A \ { 4 , \ } B
能够得结果A A A A B或A A A A A A A B,但不能为A A A B。
如给出出现次数范围,例如A出现2次到4次之间:
A \ { 2 , 4 \ } B
则结果为A A B、A A A B、A A A A B,而不是A B或A A A A A B等。

########################
经常使用的正则表达式举例
^ 对行首
$ 对行尾
^ [ t h e ] 对以t h e开头行
[ S s ] i g n a [ l L ] 对匹配单词s i g n a l、s i g n a L、
S i g n a l、S i g n a L
[Ss]igna[lL]\. 对同上,但加一句点
[ m a y M A Y ] 对包含m a y大写或小写字母的

^ U S E R $ 对只包含U S E R的行
[tty]$ 对以t t y结尾的行
\ . 对带句点的行
^ d . . x . . x . . x 对对用户、用户组及其他用户
组成员有可执行权限的目录
^ [ ^ l ] 对排除关联目录的目录列表
[ . * 0 ] 对0之前或之后加任意字符
[ 0 0 0 * ] 对0 0 0或更多个
[ iI] 对大写或小写I
[ i I ] [ n N ] 对大写或小写i或n
[ ^ $ ] 对空行
[ ^ . * $ ] 对匹配行中任意字符串
^ . . . . . . $ 对包括6个字符的行
[a- zA-Z] 对任意单字符
[ a - z ] [ a - z ] * 对至少一个小写字母
[ ^ 0 - 9 \ $ ] 对非数字或美元标识
[ ^ 0 - 0 A - Z a - z ] 对非数字或字母
[ 1 2 3 ] 对1到3中一个数字
[ D d ] e v i c e 对单词d e v i c e或D e v i c e
D e . . c e 对前两个字母为D e,后跟两个任意字符,最后为c e
\ ^ q 对以^ q开始行
^ . $ 对仅有一个字符的行
^\.[0-9][0-9] 对以一个句点和两个数字开始的行
' " D e v i c e " ' 对单词d e v i c e
D e [ V v ] i c e \ . 对单词D e v i c e或d e v i c e
[ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 4 \ } 对日期格式d d - m m - y y y y
[ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } 对I P地址格式nnn. nnn.nnn.nnn
[ ^ . * $ ] 对匹配任意行

经常使用正则表达的命令 grep awk sed


2004-10-27
grep **********************************

在g r e p 命令中输入字符串参数时,最好将其用双引号括起来。例如:“m y s t r i n g ”。这样做
有两个原因,一是以防被误解为s h e l l 命令,二是能够用来查找多个单词组成的字符串,例如:
“jet plane ”,假如不用双引号将其括起来,那么单词p l a n e 将被误认为是个文档,查询结果
将返回“文档不存在”的错误信息。
在调用变量时,也应该使用双引号,诸如:g r e p “$ M Y VA R ”文档名,假如不这样,将
没有返回结果。在g r e p 命令中输入字符串参数时,最好将其用双引号括起来。例如:“m y s t r i n g ”。这样做
有两个原因,一是以防被误解为s h e l l 命令,二是能够用来查找多个单词组成的字符串,例如:
“jet plane ”,假如不用双引号将其括起来,那么单词p l a n e 将被误认为是个文档,查询结果
将返回“文档不存在”的错误信息。
在调用变量时,也应该使用双引号,诸如:g r e p “$ M Y VA R ”文档名,假如不这样,将
没有返回结果。


-s 屏蔽错误信息
-i 区分大小写
-v 反向查找,就是找不包含的
-w 只查找指定的单词
-E 扩充模式 比如查找 you 或hong grep -E 'you|hong'

使用g r e p抽取精确匹配的一种更有效方式是在抽取字符串后加\ >。

文章整理:西部数码--专业提供域名注册虚拟主机服务
http://www.west263.com
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!