一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python3爬蟲中關于Ajax分析方法的總結

Python3爬蟲中關于Ajax分析方法的總結

2020-07-11 10:36愛喝馬黛茶的安東尼 Python

在本篇文章里小編給大家整理的是一篇關于Python3爬蟲中關于Ajax分析方法的總結,需要的朋友們可以學習下。

這里還以前面的微博為例,我們知道拖動刷新的內容由Ajax加載,而且頁面的URL沒有變化,那么應該到哪里去查看這些Ajax請求呢?

1. 查看請求

這里還需要借助瀏覽器的開發者工具,下面以Chrome瀏覽器為例來介紹。

首先,用Chrome瀏覽器打開微博的鏈接https://m.weibo.cn/u/2830678474,隨后在頁面中點擊鼠標右鍵,從彈出的快捷菜單中選擇“檢查”選項,此時便會彈出開發者工具,如圖6-2所示:

Python3爬蟲中關于Ajax分析方法的總結

此時在Elements選項卡中便會觀察到網頁的源代碼,右側便是節點的樣式。

不過這不是我們想要尋找的內容。切換到Network選項卡,隨后重新刷新頁面,可以發現這里出現了非常多的條目,如圖6-3所示。

Python3爬蟲中關于Ajax分析方法的總結

前面也提到過,這里其實就是在頁面加載過程中瀏覽器與服務器之間發送請求和接收響應的所有記錄。

Ajax其實有其特殊的請求類型,它叫作xhr。在圖6-3中,我們可以發現一個名稱以getIndex開頭的請求,其Type為xhr,這就是一個Ajax請求。用鼠標點擊這個請求,可以查看這個請求的詳細信息,如圖6-4所示。

Python3爬蟲中關于Ajax分析方法的總結

在右側可以觀察到其Request Headers、URL和Response Headers等信息。其中Request Headers中有一個信息為X-Requested-With:XMLHttpRequest,這就標記了此請求是Ajax請求,如圖6-5所示。

Python3爬蟲中關于Ajax分析方法的總結

隨后點擊一下Preview,即可看到響應的內容,它是JSON格式的。這里Chrome為我們自動做了解析,點擊箭頭即可展開和收起相應內容,如圖6-6所示。

Python3爬蟲中關于Ajax分析方法的總結

觀察可以發現,這里的返回結果是我的個人信息,如昵稱、簡介、頭像等,這也是用來渲染個人主頁所使用的數據。JavaScript接收到這些數據之后,再執行相應的渲染方法,整個頁面就渲染出來了。

另外,也可以切換到Response選項卡,從中觀察到真實的返回數據,如圖6-7所示。

Python3爬蟲中關于Ajax分析方法的總結

接下來,切回到第一個請求,觀察一下它的Response是什么,如圖6-8所示。

Python3爬蟲中關于Ajax分析方法的總結

這是最原始的鏈接https://m.weibo.cn/u/2830678474返回的結果,其代碼只有不到50行,結構也非常簡單,只是執行了一些JavaScript。

所以說,我們看到的微博頁面的真實數據并不是最原始的頁面返回的,而是后來執行JavaScript后再次向后臺發送了Ajax請求,瀏覽器拿到數據后再進一步渲染出來的。

2. 過濾請求

接下來,再利用Chrome開發者工具的篩選功能篩選出所有的Ajax請求。在請求的上方有一層篩選欄,直接點擊XHR,此時在下方顯示的所有請求便都是Ajax請求了,如圖6-9所示。

Python3爬蟲中關于Ajax分析方法的總結

接下來,不斷滑動頁面,可以看到頁面底部有一條條新的微博被刷出,而開發者工具下方也一個個地出現Ajax請求,這樣我們就可以捕獲到所有的Ajax請求了。

隨意點開一個條目,都可以清楚地看到其Request URL、Request Headers、Response Headers、Response Body等內容,此時想要模擬請求和提取就非常簡單了。

圖6-10所示的內容便是我的某一頁微博的列表信息。

Python3爬蟲中關于Ajax分析方法的總結

到現在為止,我們已經可以分析出來Ajax請求的一些詳細信息了,接下來只需要用程序模擬這些Ajax請求,就可以輕松提取我們所需要的信息了。

在下一節中,我們用Python實現Ajax請求的模擬,從而實現數據的抓取。

以上就是Python3爬蟲中關于Ajax分析方法的總結的詳細內容,更多關于Python3爬蟲里Ajax分析方法的資料請關注服務器之家其它相關文章!

原文鏈接:https://www.py.cn/spider/guide/14486.html

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 午夜伦理yy44008影院 | 国产99视频精品免视看7 | 国产欧美久久一区二区 | 视频在线观看国产 | 精品国产品香蕉在线观看 | 侵犯小男生免费视频网站 | 婷婷精品进入 | 高h辣h双处全是肉军婚 | 精品人伦一区二区三区潘金莲 | 国产亚洲一级精品久久 | 99视频在线国产 | 视频二区 素人 欧美 日韩 | 韩国三级在线播放 | 日韩欧美一区二区三区四区 | 亚洲欧美国产在线 | 校园全黄h全肉细节文 | 亚洲欧美日韩成人 | 欧美怡红院视频一区二区三区 | 色琪琪久久草在线视频 | 护士videossexo另类 | 日本人添下面的全过程 | 亚洲成人黄色网址 | 黑帮大佬与我的365天2标清中文 | 国产好深好硬好爽我还要视频 | 亚洲va欧美va天堂v国产综合 | 亚洲a区视频 | 国产大乳美女挤奶视频 | 高h文3p双龙 | chaopeng在线观看 | 性啪啪chinese东北女人 | 欧美人在线一区二区三区 | 古装一级无遮挡毛片免费观看 | 奇米影视亚洲狠狠色 | 青青草99久久精品国产综合 | 日韩欧美亚洲国产高清在线 | 国产真实伦对白在线播放 | 热久久99精品这里有精品 | 四虎精品永久在线网址 | 四虎1515hhcom| 波多野结衣在线中文字幕 | 国产亚洲精品综合在线网址 |