在python中使用xpath定位時,有時候會先用.xpath定位到一個地點,for循環后,繼續使用.xpath,但是會出現問題,比如在下面這個例子中:
根據xpath定位到了tr,注意游覽器自動生成了tbody,在python中要把自動生成的tbody層級去掉。
此時我們想獲取tr下面的td,請看代碼
import requests from lxml import etree url = "https://www.w3school.com.cn/xpath/xpath_axes.asp" res = requests.get(url).text html = etree.HTML(res) a = html.xpath("(//table[@class='dataintable'])[1]/tr") print(a) for i in a: s = i.xpath("//td") print(s) print(len(s))
for i in a下,我們想找到的是每個tr下面的td,按理來說只有兩個,但是返回的卻是全部的44個td,問題出在哪里呢?原來是s = i.xpath("//td")這個寫法不對,雖然 i 繼承了 a 的xpath路徑,但是如果寫成//td,等于告訴xpath重新搜索全部,必須要加上點才可以。s = i.xpath(".//td"),一個點代表當前目錄,兩個點代表上級目錄
這次搜索正常了
總結:除非在一開始的搜索式直接寫成 (//table[@class='dataintable'])[1]/tr//td,這樣直接搜索td,不用帶點,在復用.xpath的時候,必須加上點表明當前目錄,否則搜索不到想要的結果
到此這篇關于關于python中.xpath的復用的文章就介紹到這了,更多相關python .xpath復用內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!
原文鏈接:https://blog.csdn.net/Peaunt_Python/article/details/121210004