正則表達(dá)式是一種特殊序列的字符,它通過使用有專門語法的模式來匹配或查找其他字符串或字符串集合。
語法
正則表達(dá)式從字面上看是一種介于斜杠之間或介于跟在 %r 后的任意分隔符之間的模式,如下所示:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
/pattern/ /pattern/im # 可以指定選項(xiàng) %r!/usr/local! # 一般的分隔的正則表達(dá)式 實(shí)例 #!/usr/bin/ruby line1 = "Cats are smarter than dogs" ; line2 = "Dogs also like meat" ; if ( line1 =~ /Cats(.*)/ ) puts "Line1 contains Cats" end if ( line2 =~ /Cats(.*)/ ) puts "Line2 contains Dogs" end |
這將產(chǎn)生以下結(jié)果:
1
|
Line1 contains Cats |
正則表達(dá)式修飾符
正則表達(dá)式從字面上看可能包含一個(gè)可選的修飾符,用于控制各方面的匹配。修飾符在第二個(gè)斜杠字符后指定,如上面實(shí)例所示。下標(biāo)列出了 可能的修飾符:
就像字符串通過 %Q 進(jìn)行分隔一樣,Ruby 允許您以 %r 作為正則表達(dá)式的開頭,后面跟著任意分隔符。這在描述包含大量您不想轉(zhuǎn)義的斜杠字符時(shí)非常有用。
1
2
3
4
5
6
7
|
# 下面匹配單個(gè)斜杠字符,不轉(zhuǎn)義 %r|/| # Flag 字符可通過下面的語法進(jìn)行匹配 %r[</(.*)>]i |
正則表達(dá)式模式
除了控制字符,(+ ? . * ^ $ ( ) [ ] { } | \),其他所有字符都匹配本身。您可以通過在控制字符前放置一個(gè)反斜杠來對(duì)控制字符進(jìn)行轉(zhuǎn)義。
下表列出了 Ruby 中可用的正則表達(dá)式語法。
搜索和替換
sub 和 gsub 及它們的替代變量 sub! 和 gsub! 是使用正則表達(dá)式時(shí)重要的字符串方法。
所有這些方法都是使用正則表達(dá)式模式執(zhí)行搜索與替換操作。sub 和 sub! 替換模式的第一次出現(xiàn),gsub 和 gsub! 替換模式的所有出現(xiàn)。
sub 和 gsub 返回一個(gè)新的字符串,保持原始的字符串不被修改,而 sub! 和 gsub! 則會(huì)修改它們調(diào)用的字符串。
下面是一個(gè)實(shí)例:
1
2
3
4
5
6
7
8
9
10
11
|
#!/usr/bin/ruby phone = "2004-959-559 #This is Phone Number" # 刪除 Ruby 的注釋 phone = phone.sub!(/ #.*$/, "") puts "Phone Num : #{phone}" # 移除數(shù)字以外的其他字符 phone = phone.gsub!(/\ D /, "" ) puts "Phone Num : #{phone}" |
這將產(chǎn)生以下結(jié)果:
1
2
|
Phone Num : 2004 - 959 - 559 Phone Num : 2004959559 |
下面是另一個(gè)實(shí)例:
1
2
3
4
5
6
7
8
9
10
11
|
#!/usr/bin/ruby text = "rails are rails, really good Ruby on Rails" # 把所有的 "rails" 改為 "Rails" text.gsub!( "rails" , "Rails" ) # 把所有的單詞 "Rails" 都改成首字母大寫 text.gsub!(/\brails\b/, "Rails" ) puts "#{text}" |
這將產(chǎn)生以下結(jié)果:
1
|
Rails are Rails, really good Ruby on Rails |