經(jīng)??吹秸f正則的文章,但說的只是方法,卻很少有說以下幾個基本概念:
1.貪婪:+,*,?,{m,n}等默認是貪婪匹配,即盡可能多匹配,也叫最大匹配
如果后面加上?,就轉(zhuǎn)化為非貪婪匹配,需要高版本支持
2.獲?。耗J用(x|y)是獲取匹配,很多時候只是測試,不一定要求得到所匹配的數(shù)據(jù),尤其在嵌套匹配或大數(shù)據(jù)中就要用非獲取匹配(?:x|y),這樣提高了效率,優(yōu)化了程序。
3.消耗:默認是消耗匹配,一般在預(yù)查中是非消耗匹配。
舉個例子,2003-2-8要變?yōu)?003-02-08
如果用/-(\d)-/第二次匹配將從8開始,從而只替換第一個2,錯誤
如果用/-(\d)(?=-)/則第二次匹配從第二個-開始,即不消耗字符-
4.預(yù)查:js中分為正向預(yù)查和負向預(yù)查
如上面的(?=pattern)是正向預(yù)查,在任何匹配 pattern 的字符串開始處匹配查找字符串。還有(?!pattern)是負向預(yù)查,在任何不匹配 pattern 的字符串開始處匹配查找字符串。負向預(yù)查有時會用在對[^]的擴充,[^]只是一些字符,而?!可以使整個字符串。
5.回調(diào):一般用在替換上,即根據(jù)不用的匹配內(nèi)容返回不用的替換值,從而簡化了程序,需要高版本支持
6.引用:\num 對所獲取的第num個匹配的引用。
例如,'(.)\1\1' 匹配AAA型。'(.)(.)\2\1' 匹配ABBA型。
當然還有很多,這些都只是基本的需要掌握的
遇到正則問題,一般可用以下兩種方法解決:
1.分類,即根據(jù)所有的可能列出各種情況,如2003以內(nèi)的數(shù)
0 0
1-999 [1-9]\d{0,2}
1000-1999 1\d{3}
2000-2003 200[0-3]
所以最后的匹配就是 (0|[1-9]\d{0,2}|1\d{3}|200[0-3])
2.分組,即將整句分為不同的最小單元,如'、%、_成雙出現(xiàn)
能成組的,即允許存在的,有
''
%% 如果是大于2的偶數(shù)個可細分為多個更小的2字符單元
__
[^'%_] 非以上字符
所以最后的匹配就是 ^(''|%%|__|[^'%_])*$
--------------------------------------------------------------------------------
replace + function 5.5+支持