一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務器之家 - 編程語言 - 正則表達式 - Python常用的正則表達式處理函數詳解

Python常用的正則表達式處理函數詳解

2020-09-07 10:43圈er 正則表達式

這篇文章主要介紹了Python常用的正則表達式處理函數,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下

正則表達式是一個特殊的字符序列,用于簡潔表達一組字符串特征,檢查一個字符串是否與某種模式匹配,使用起來十分方便。

在python中,我們通過調用re庫來使用re模塊:

import re

正則表達式語法模式和操作符詳見:https://www.runoob.com/python/python-reg-expressions.html#flags

下面介紹python常用的正則表達式處理函數。

re.match函數

re.match 函數從字符串的起始位置匹配正則表達式,返回match對象,如果不是起始位置匹配成功的話,match()就返回none。

re.match(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字符串。

flags:標志位,用于控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等。具體參數為:

re.i:忽略大小寫。

re.l:表示特殊字符集 \w, \w, \b, \b, \s, \s 依賴于當前環境。

re.m:多行模式。

re.s:即 . ,并且包括換行符在內的任意字符(. 不包括換行符)。

re.u:表示特殊字符集 \w, \w, \b, \b, \d, \d, \s, \s 依賴于 unicode 字符屬性數據庫。

re.x:為了增加可讀性,忽略空格和 # 后面的注釋。

?
1
2
3
4
5
6
7
import re
#從起始位置匹配
r1=re.match('abc','abcdefghi')
print(r1)
#不從起始位置匹配
r2=re.match('def','abcdefghi')
print(r2)

運行結果:

Python常用的正則表達式處理函數詳解

其中,span表示匹配成功的整個子串的索引。

使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。

group(num):匹配的整個表達式的字符串,group() 可以一次輸入多個組號,這時它將返回一個包含那些組所對應值的元組。

groups():返回一個包含所有小組字符串的元組,從 1 到 所含的小組號。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import re
 
s='this is a demo'
r1=re.match(r'(.*) is (.*)',s)
r2=re.match(r'(.*) is (.*?)',s)
 
print(r1.group())
print(r1.group(1))
print(r1.group(2))
print(r1.groups())
print()
print(r2.group())
print(r2.group(1))
print(r2.group(2))
print(r2.groups())

運行結果:

Python常用的正則表達式處理函數詳解

上述代碼中的(.*)和(.*?)表示正則表達式的貪婪匹配與非貪婪匹配,詳情見此:

re.search函數

re.search函數掃描整個字符串并返回第一個成功的匹配,如果匹配成功則返回match對象,否則返回none。

re.search(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字符串。

flags:標志位,用于控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等等。

?
1
2
3
4
5
6
7
import re
#從起始位置匹配
r1=re.search('abc','abcdefghi')
print(r1)
#不從起始位置匹配
r2=re.search('def','abcdefghi')
print(r2)

運行結果:

Python常用的正則表達式處理函數詳解

使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式。

group(num=0):匹配的整個表達式的字符串,group() 可以一次輸入多個組號,這時它將返回一個包含那些組所對應值的元組。

groups():返回一個包含所有小組字符串的元組,從 1 到 所含的小組號。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import re
 
s='this is a demo'
r1=re.search(r'(.*) is (.*)',s)
r2=re.search(r'(.*) is (.*?)',s)
 
print(r1.group())
print(r1.group(1))
print(r1.group(2))
print(r1.groups())
print()
print(r2.group())
print(r2.group(1))
print(r2.group(2))
print(r2.groups())

運行結果:

Python常用的正則表達式處理函數詳解


從上面不難發現re.match與re.search的區別:re.match只匹配字符串的起始位置,只要起始位置不符合正則表達式就匹配失敗,而re.search是匹配整個字符串,直到找到一個匹配為止。

re.compile 函數

compile 函數用于編譯正則表達式,生成一個正則表達式對象,供 match() 和 search() 這兩個函數使用。

re.compile(pattern[, flags])

pattern:一個字符串形式的正則表達式。

flags:可選,表示匹配模式,比如忽略大小寫,多行模式等。

?
1
2
3
4
5
6
7
8
9
10
import re
#匹配數字
r=re.compile(r'\d+')
r1=r.match('this is a demo')
r2=r.match('this is 111 and that is 222',0,27)
r3=r.match('this is 111 and that is 222',8,27)
 
print(r1)
print(r2)
print(r3)

運行結果:

Python常用的正則表達式處理函數詳解

findall函數

搜索字符串,以列表形式返回正則表達式匹配的所有子串,如果沒有找到匹配的,則返回空列表。

需要注意的是,match 和 search 是匹配一次,而findall 匹配所有。

findall(string[, pos[, endpos]])

string:待匹配的字符串。

pos:可選參數,指定字符串的起始位置,默認為0。

endpos:可選參數,指定字符串的結束位置,默認為字符串的長度。

?
1
2
3
4
5
6
7
8
9
10
import re
#匹配數字
r=re.compile(r'\d+')
r1=r.findall('this is a demo')
r2=r.findall('this is 111 and that is 222',0,11)
r3=r.findall('this is 111 and that is 222',0,27)
 
print(r1)
print(r2)
print(r3)

運行結果:

Python常用的正則表達式處理函數詳解

re.finditer函數

和 findall 類似,在字符串中找到正則表達式所匹配的所有子串,并把它們作為一個迭代器返回。

re.finditer(pattern, string, flags=0)

pattern:匹配的正則表達式。

string:待匹配的字符串。

flags:標志位,用于控制正則表達式的匹配方式,如是否區分大小寫,多行匹配等。

?
1
2
3
4
5
import re
 
r=re.finditer(r'\d+','this is 111 and that is 222')
for i in r:
 print (i.group())

運行結果:

Python常用的正則表達式處理函數詳解

re.split函數

將一個字符串按照正則表達式匹配的子串進行分割后,以列表形式返回。

re.split(pattern, string[, maxsplit=0, flags=0])

pattern:匹配的正則表達式。

string:待匹配的字符串。

maxsplit:分割次數,maxsplit=1分割一次,默認為0,不限次數。

flags:標志位,用于控制正則表達式的匹配方式,如:是否區分大小寫,多行匹配等。

?
1
2
3
4
5
6
7
8
9
10
import re
 
r1=re.split('\w+','this is 111 and that is 222')
r2=re.split('\w+','this is 111 and that is 222',maxsplit=1)
r3=re.split('\d+','this is 111 and that is 222')
r4=re.split('\d+','this is 111 and that is 222',maxsplit=1)
print(r1)
print(r2)
print(r3)
print(r4)

運行結果:

Python常用的正則表達式處理函數詳解

re.sub函數

re.sub函數用于替換字符串中的匹配項。

re.sub(pattern, repl, string, count=0, flags=0)

pattern:正則中的模式字符串。

repl:替換的字符串,也可為一個函數。

string:要被查找替換的原始字符串。

count:模式匹配后替換的最大次數,默認0表示替換所有的匹配。

?
1
2
3
4
5
6
7
8
9
import re
 
r='this is 111 and that is 222'
# 刪除字符串中的數字
r1=re.sub(r'\d+','',r)
print(r1)
# 刪除非數字的字符串
r2=re.sub(r'\d','',r)
print(r2)

運行結果:

Python常用的正則表達式處理函數詳解

參考資料:https://www.runoob.com/python/python-reg-expressions.html#flags

到此這篇關于python常用的正則表達式處理函數詳解的文章就介紹到這了,更多相關python 正則表達式處理函數內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!

原文鏈接:https://www.cnblogs.com/BIXIABUMO/p/12041544.html

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 国产123区在线视频观看 | 热久久亚洲 | 欧美日韩中文字幕久久伊人 | 国产精品每日在线观看男人的天堂 | 欧美性xxx狂流白浆 欧美性f | www.一区二区三区.com | 四虎精品成人免费观看 | 国产91青青成人a在线 | 1769在线视频 | 免费精品视频在线 | 欧美日韩成人在线视频 | 激情六月丁香婷婷四房播 | 91最新国产 | www.av在线视频 | 成 人 亚洲 综合天堂 | 17个农民工婉莹第一部 | 东北疯狂xxxxbbbb中国 | aaaa黄| 亚洲男人天堂2023 | 草莓视频网站18勿进 | 福利一区二区在线观看 | 色天天综合色天天碰 | 91gmail国产| 日韩欧美国内 | 厨房play黄瓜进入 | 猫咪色网 | a一区二区三区视频 | 3黑人巨大vs北岛玲 3d肉浦团在线观看 3d动漫免费 | 欧美干b视频 | 高h细节肉爽文办公室 | 国语自产拍在线播放不卡 | 欧美一区二区三 | 日本伊人色综合网 | 国产极品麻豆91在线 | 日韩精品一区二区三区毛片 | 九九99热久久999精品 | 亚洲精品乱码久久久久久蜜桃欧美 | 亚洲国产三级在线观看 | 免费在线观看中文字幕 | 国产在线步兵一区二区三区 | 99热在这里只有精品 |