今天傍晚,莫言在Q群里贴了一个他写的正则表达式,回来翻了翻perlre文档,基本算是看懂,赶紧记录下来:
perlmy $ip = "192.168.0.1|192.168.0.2|192.168.0.1";
if ( $ip =~ /
^
(?:
((?:\d{1,3}\.){3}\d{1,3})
(?=
(?:
\|(?!\1)(?1)
)*
\z
)
\|
)*
(?1)
$
/x ) {
print "match\n";
}
根据perlre文档的说明,一点一点解释。
然后一个隔开ip的 | ; |
然后是\1,这个就是前面捕获的$1,跟上行解释的断言合在一起,就是 | 后面不能有和前面匹配的ip重复; |
然后是)*,这个)闭合到 | 前面的(?:,也就是说 | ip可以重复多个; |
然后是|和)*,这里闭合到^(,表示符合不重复ip条件的ip | 格式不断正则匹配; |
OK,解释完毕。其实,从后往前看,反而清晰一些~~
另:perlre中在(??{CODE})段的表述中有如下一段话“In perl 5.12.x and earlier, because the regex engine was not re-entrant, delayed code could not safely invoke the regex engine either directly with “m//” or “s///”), or indirectly with functions such as “split”.”,而(?R)和(??{CODE})做的是类似而简单的任务,所以如果linux发行版里带的perl版本不够高的话,这里就不能用(?1)的简单写法,需要自己再写一遍了。
可以这么判断:
my $re = $^V lt v5.14 ? '(?:\d{1,3}\.?){4}' : '(?1)';
my $ip = "192.168.0.1|192.168.0.2|192.168.0.3|192.168.0.4|192.168.0.5";
if ( $ip =~ m/
^
(?:
((?:\d{1,3}\.?){4})
(?=
(?:
\|(?!\1)$re
)*
\z
)
\|
)*
$re
$
/x ) {
print "$1 match\n";
}