正則表達式是一個特殊的字符序列可以幫助匹配或者找到其他字符串或串套,使用的模式保持一個專門的語法。
正則表達式文本是一個模式之間的斜線之間或任意分隔符 %r 如下:
語法:
/pattern/im # option can be specified
%r!/usr/local! # general delimited regular expression
例如:
1
2
3
4
5
6
7
8
9
10
11
|
#!/usr/bin/ruby line1 = "Cats are smarter than dogs" ; line2 = "Dogs also like meat" ; if ( line1 =~ /Cats(.*)/ ) puts "Line1 starts with Cats" end if ( line2 =~ /Cats(.*)/ ) puts "Line2 starts with Dogs" end |
這將產生以下結果:
1
|
Line1 starts with Cats |
正則表達式修飾符:
正則表達式的文字可以包括一個可選的修飾符來控制各方面的匹配。修改指定第二個斜杠字符后,如前面所示,可表示為這些字符之一:
%Q分隔字符串文字一樣,Ruby允許正則表達式帶 %r,然后由所選擇的定界符。這是非常有用的,當所描述的模式中包含正斜杠字符不希望轉義:
1
2
3
4
5
|
# Following matches a single slash character, no escape required %r|/| # Flag characters are allowed with this syntax, too %r[</(.*)>]i |
正則表達式模式:
除控制字符, (+ ? . * ^ $ ( ) [ ] { } | ), 所有字符匹配。可以轉義控制字符前面加上反斜線。
搜索和替換:
String方法最重要的,使用正則表達式sub 和 gsub,他們就地變種sub! 和 gsub!
所有這些方法執行搜索和替換操作過程中使用一個正則表達式模式。sub & sub!替換第一次出現的模式 gsub & gsub!替換所有出現。
sub! 和 gsub! 返回一個新的字符串,未經修改的原始 sub 和 gsub 他們被稱為修改字符串。
下面的例子:
1
2
3
4
5
6
7
8
9
10
11
|
#!/usr/bin/ruby phone = "2004-959-559 #This is Phone Number" # Delete Ruby-style comments phone = phone.sub!(/ #.*$/, "") puts "Phone Num : #{phone}" # Remove anything other than digits phone = phone.gsub!(/ D /, "" ) puts "Phone Num : #{phone}" |
這將產生以下結果:
1
2
|
Phone Num : 2004 - 959 - 559 Phone Num : 2004959559 |
下面是另一個例子:
1
2
3
4
5
6
7
8
9
10
11
|
#!/usr/bin/ruby text = "rails are rails, really good Ruby on Rails" # Change "rails" to "Rails" throughout text.gsub!( "rails" , "Rails" ) # Capitalize the word "Rails" throughout text.gsub!(/rails/, "Rails" ) puts "#{text}" |
這將產生以下結果:
1
|
Rails are Rails, really good Ruby on Rails |