本文實例講述了python使用正則表達式提取網頁URL的方法。分享給大家供大家參考。具體實現方法如下:
1
2
3
4
5
6
7
8
9
10
|
import re import urllib url = "http://www.ythuaji.com.cn" s = urllib.urlopen(url).read() ss = s.replace( " " ,"") urls = re.findall(r "<a.*?href=.*?<\/a>" ,ss,re.I) for i in urls: print i else : print 'this is over' |
希望本文所述對大家的Python程序設計有所幫助。