转载

JavaScript与PHP中正则

一、JavaScript

有个在线调试正则的工具, 点击查看工具 。下面的所有示例代码,都可以在 codepen 上查看到。

1.创建正则表达式

var re = /ab+c/; //方式一 正则表达式字面量  var re = new RegExp("ab+c");  //方式二 RegExp对象的构造函

1)正则表达式字面量在脚本加载后编译。若你的正则表达式是常量,使用这种方式可以获得更好的性能。

2)使用构造函数,提供了对正则表达式运行时的编译。当你知道正则表达式的模式会发生改变, 或者你事先并不了解它的模式或者是从其他地方(比如用户的输入),得到的代码这时比较适合用构造函数的方式。

2.正则表达式中的特殊字符

/    ^    $    *    +    ?    .    (x)    (?:x)    x(?=y)    x(?!y)    x|y    {n}     {n,m}    [xyz]    [^xyz]    [/b]    /b    /B    /cX    /d    /D    /f    /n    /r      /s    /S    /t    /v    /w    /W    /n    /0    /xhh    /uhhhh

3.正则表达式中的方法

6 个,分别是 exectestmatchsearchreplacesplit

exec和test的语法都是regexObj调用,match、search、replace和split的语法都是string调用。

exec

方法为指定的一段字符串执行搜索匹配操作。它的返回值是一个 数组或者 null 。语法如下:

示例代码:

var re = /quick/s(brown).+?(jumps)/ig; var result = re.exec('The Quick Brown Fox Jumps Over The Lazy Dog');

返回结果:

test

一个在字符串中测试是否匹配的RegExp方法,它 返回true或false 。语法如下:

match

一个在字符串中执行查找匹配的RegExp方法,它返回一个 数组或者在未匹配到时返回null

与exec略有不同,首先是调用方式,math是由字符串调用,而exec是由RegexObj调用。

其次,如果表达式中有“g”标记,那么返回一个匹配的字符串数组,如果没有就会和exec返回的一样。下面这个demo就是有“g”。语法如下:

示例代码:

var re = /quick/s(brown).+?(jumps)/ig; var result = re.exec('The Quick Brown Fox Jumps Over The Lazy Dog');

返回结果:

search:

一个在字符串中测试匹配的String方法,它返回匹配到的位置索引, 或者在失败时返回-1 。语法如下:

例如上面的示例代码如果是调用search,返回数据就是4。

replace:

一个在字符串中执行查找匹配的String方法,并且使用替换字符串替换掉匹配到的子字符串。语法如下:

var re = /(/w+)/s(/w+)/; var str = "John Smith"; var result = str.replace(re, "$2, $1");

返回的结果将是:“Smith, John”

split

一个使用正则表达式或者一个固定字符串分隔一个字符串,并将分隔后的子字符串存储到数组中的String方法。语法如下:

limit就是限制分割后的数组中的个数。下面的是一个demo,但是表达式中有一个是加了括号,一个没加,返回的数据是不一样的。

示例代码:

var re = /(/d)/; var result = 'Hello 1 word. Sentence number 2.'.split(re); console.log(result); var re = //d/; var result = 'Hello 1 word. Sentence number 2.'.split(re); console.log(result);

返回结果:

4.正则表达式执行返回信息

var myRe = new RegExp("d(b+)d", "g"); var myArray = myRe.exec("cdbbdbsbz"); console.log(myArray);

代码中返回的结果如下:

5.正则表达式标志

var re = //w+/s/g;//表达式一 var re = new RegExp("//w+//s", "g");//表达式二 var str = "fee fi fo fum"; var myArray = str.match(re); console.log(myArray);

表达式一和表达式二返回的结果是一样的。都是下面的那个数组:

二、PHP

下面的示例代码可以在 ideone 中查看到。

1.创建正则表达式

$regex = '//d/i';

与JavaScript中的第一个方式有点像,只是这里的话是个字符串。

2.正则表达式中的特殊字符

特殊字符有:   . / + * ? [ ^ ] $ ( ) { } = ! < > | : -

3.正则表达式中的函数

8 个方法, preg_matchpreg_match_allpreg_replacepreg_replace_callbackpreg_greppreg_splitpreg_last_errorpreg_quote

preg_match:

执行一个正则表达式匹配

返回 pattern 的匹配次数 。 它的值将是0次(不匹配)或1次,因为preg_match()在 第一次匹配后,将会停止搜索

$subject = "dd133aa2"; $pattern = '//d+/'; preg_match($pattern, $subject, $matches, PREG_OFFSET_CAPTURE); print_r($matches);

上面的示例代码加了参数“ PREG_OFFSET_CAPTURE ”,这样的话,在$matches中会多一个偏移数。例如下面的“2”

preg_match_all:

执行一个“全局”正则表达式匹配

返回完整匹配次数 (可能是0),或者如果发生错误返回 FALSE

下面的代码中$subject和$pattern与上面的都一样,唯一不同的是preg_match换成了preg_match_all。

preg_match_all($pattern, $subject, $matches, PREG_OFFSET_CAPTURE); print_r($matches);

返回的次数是2,匹配到了两次,再看看数组$matches中的输入,有两个。比上面的多了一个。

preg_replace:

执行一个正则表达式的搜索和替换

如果subject是一个数组, preg_replace() 返回一个数组 , 其他情况下返回 一个字符串

如果匹配被查找到,替换后的subject被返回,其他情况下 返回没有改变的 subject。如果发生错误,返回 NULL

在代码中$subject是一个数组,里面有两组字符串,接下来是将多个数字替换为大写的“Z”。

$subject = array("dd133aa2", "kk1ff3"); $pattern = '//d+/'; $result = preg_replace($pattern, 'Z', $subject); print_r($result);

preg_replace_callback:

执行一个正则表达式搜索并且使用一个“回调”进行替换

这个函数的行为除了可以指定一个 callback 替代replacement进行替换 字符串的计算,其他方面等同于 preg_replace(),包括返回的结果。

下面的代码也是替换成大写的“Z”,回调函数中每次$matches中的内容就是代码中注释的部分,第一次是133,第二次是2。

$subject = "dd133aa2"; $pattern = '//d+/'; $result = preg_replace_callback($pattern, function($matches) {                 //$matches [0] => 133                 //$matches [0] => 2                 return 'Z';           }, $subject); print_r($result);

preg_grep:

返回匹配模式的数组条目

返回使用input中key做 索引的数组

下面的示例代码中,在$subject数组中我加了个“ddsdfd”,里面没有包含数字,在做匹配的时候,就把这个没数字的给过滤掉了。

而$result2打印出来的正好相反,是把过滤的打印出来了,但是key还是为2,并不是0。

$subject = array("dd133aa2", "kk1ff3", "ddsdfd"); $pattern = '//d+/'; $result = preg_grep($pattern, $subject); $result2 = preg_grep($pattern, $subject, PREG_GREP_INVERT); print_r($result); print_r($result2);

preg_split:

通过一个正则表达式分隔字符串

返回一个使用 pattern 边界分隔 subject 后得到 的子串组成的 数组

下面代码中,我将$pattern中的表达式加了括号,为了在$result2中捕获到。

$subject = "dd133aa2cc"; $pattern = '/(/d+)/'; $result = preg_split($pattern, $subject); $result2 = preg_split($pattern, $subject, null, PREG_SPLIT_DELIM_CAPTURE); print_r($result); print_r($result2);

preg_last_error:

返回最后一个PCRE正则执行产生的错误代码

preg_match('/(?:/D+|</d+>)*[!?]/', 'foobar foobar foobar'); $result = preg_last_error();//PREG_BACKTRACK_LIMIT_ERROR 调用回溯限制超出 print_r($result);

preg_quote:

转义正则表达式字符

返回 转义后的字符串

下面的代码中,$subject中有两个需要转义的字符,“.”和“?”。

将$result打印出后是“dd/.a/?a2cc”,而在$result2中,多加了个参数“a”,这样的话“a”也会被转义,“dd/./a/?/a2cc”

$subject = "dd.a?a2cc"; $result = preg_quote($subject); $result2 = preg_quote($subject, 'a'); print_r($result); print_r($result2);

4.模式修正符

参考资料:

https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions 创建一个正则表达式

http://www.5idev.com/p-php_regular_syntax_2.shtml PHP 正则表达式语法

https://www.ibm.com/developerworks/cn/opensource/os-php-regex1/ 掌握 PHP 中的正则表达式

正文到此结束
Loading...