一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語(yǔ)言編程技術(shù)及教程分享平臺(tái)!
分類導(dǎo)航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務(wù)器之家 - 腳本之家 - Python - Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

2022-01-24 00:37松鼠愛吃餅干 Python

讀萬(wàn)卷書不如行萬(wàn)里路,學(xué)的扎不扎實(shí)要通過實(shí)戰(zhàn)才能看出來(lái),本篇文章手把手帶你爬下騰訊視頻的m3u8格式來(lái)分析,大家可以在過程中查缺補(bǔ)漏,看看自己掌握程度怎么樣

普通爬蟲正常流程:

  • 數(shù)據(jù)來(lái)源分析
  • 發(fā)送請(qǐng)求
  • 獲取數(shù)據(jù)
  • 解析數(shù)據(jù)
  • 保存數(shù)據(jù)

 

環(huán)境介紹

  • python 3.8
  • pycharm 2021專業(yè)版

【付費(fèi)VIP完整版】只要看了就能學(xué)會(huì)的教程,80集Python基礎(chǔ)入門視頻教學(xué)

點(diǎn)這里即可免費(fèi)在線觀看

 

分析網(wǎng)站

先打開開發(fā)者工具,然后搜索m3u8,會(huì)返回給你很多的ts的文件,像這種ts文件,就是視頻的片段

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

我們可以復(fù)制url地址,在新的瀏覽頁(yè)打開

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

然后會(huì)給我們下載ts的文件,打開文件,就會(huì)發(fā)現(xiàn)是十多秒的視頻片段

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

所以說(shuō)這些數(shù)據(jù)的數(shù)據(jù)還是比較好找的,只要我們找到地址是從哪里來(lái)的

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

找到url地址,因?yàn)槭莗ost請(qǐng)求,所以需要下面的表達(dá)參數(shù)

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

 

開始代碼

導(dǎo)入模塊

import requests
import re
from tqdm import tqdm # 進(jìn)度條展示

數(shù)據(jù)請(qǐng)求

url = 'https://vd.l.qq.com/proxyhttp'
data = {"buid":"vinfoad","adparam":"pf=in&ad_type=LD%7CKB%7CPVL&pf_ex=pc&url=https%3A%2F%2Fv.qq.com%2Fx%2Fcover%2Fj3czmhisqin799r.html&refer=https%3A%2F%2Fv.qq.com%2Fx%2Fsearch%2F&ty=web&plugin=1.0.0&v=3.5.57&coverid=j3czmhisqin799r&vid=z002615k57t&pt=&flowid=e9b3e49b2593efd194cbcd24030ed803_10201&vptag=www_baidu_com%7Cvideo%3Aposter_tle&pu=-1&chid=0&adaptor=2&dtype=1&live=0&resp_type=json&guid=4b4e192e83f4abaf8b68df3e4f5be769&req_type=1&from=0&appversion=1.0.166&uid=522810848&tkn=fbYfeWDCLKtAaOd_OGvCNg..&lt=qq&platform=10201&opid=5FE180427A4C883F69CADDED665CE99B&atkn=49C1A486316C8D269AC65AAC080CFB29&appid=101483052&tpid=1&rfid=86c3f668da63d8bc7aab3fbc1eb7378a_1633763084","vinfoparam":"spsrt=1&charge=0&defaultfmt=auto&otype=ojson&guid=4b4e192e83f4abaf8b68df3e4f5be769&flowid=e9b3e49b2593efd194cbcd24030ed803_10201&platform=10201&sdtfrom=v1010&defnpayver=1&appVer=3.5.57&host=v.qq.com&ehost=https%3A%2F%2Fv.qq.com%2Fx%2Fcover%2Fj3czmhisqin799r.html&refer=v.qq.com&sphttps=1&tm=1633767536&spwm=4&logintoken=%7B%22main_login%22%3A%22qq%22%2C%22openid%22%3A%225FE180427A4C883F69CADDED665CE99B%22%2C%22appid%22%3A%22101483052%22%2C%22access_token%22%3A%2249C1A486316C8D269AC65AAC080CFB29%22%2C%22vuserid%22%3A%22522810848%22%2C%22vusession%22%3A%22fbYfeWDCLKtAaOd_OGvCNg..%22%7D&vid=z002615k57t&defn=fhd&fhdswitch=0&show1080p=1&isHLS=1&dtype=3&sphls=2&spgzip=1&dlver=2&drm=32&hdcp=0&spau=1&spaudio=15&defsrc=2&encryptVer=9.1&cKey=W5agxKnJ7N56KJEItZs_lpJX5WB4a2CdS8kEIo8rVaqtHEZQ1c_W6myJ8hQXnmDDG8ErEJDMLjvm2vPBr-xE-uhvZyEMY131vUh1H4pgCXe2OphM_H32Jqtu2hFoqfA-un0sVBkIXYfWkOdABnbLUo4RgzSXkBHF3N3K7dNKPg_56X9JO3gwBMyBeAex05x8SbbQKY5AXaDVSM7hsBQ8XEeHzIEGJzlCt94ONgPYVSRkZqo51NVr_Bs8h4-UNLT0jG-obbyNs2IJhrZ4JUBeuGEk8zAOhE9HTZPNDViLRIyt2mNDud09qSLLKl4XAj3CE6i26P6BRyAy1_qatijXkm9J1hs3ZYC7dgYmAZD6BE9UGX4hkziTy-Y8cCBppeEBGSaj9w&fp2p=1&spadseg=3"}

headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36'
}
response = requests.post(url=url, json=data, headers=headers)

提取數(shù)據(jù)

html_data = response.json()['vinfo']
# 正則表達(dá)式
m3u8_url = re.findall("url(.*?),", html_data)[3].split('"')[2]
m3u8_data = requests.get(url=m3u8_url).text
m3u8_data = re.sub('#EXTM3U', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-VERSION:\d', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-MEDIA-SEQUENCE:\d', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-TARGETDURATION:\d+', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-PLAYLIST-TYPE:VOD', '', m3u8_data)
m3u8_data = re.sub('#EXTINF:\d+\.\d+,', '', m3u8_data)
m3u8_data = re.sub('#EXT-X-ENDLIST', '', m3u8_data).split()

遍歷

for ts in tqdm(m3u8_data):
  ts_url = 'https://apd-57c5d150c8b9788baf40ea4f65feddf8.v.smtcdns.com/moviets.tc.qq.com/A2k4JuW9ATia8thdFQ6y5HWRUGLqAr4L5fk9KFbAUEI8/uwMROfz2r5xgoaQXGdGnC2df64gVTKzl5C_X6A3JOVT0QIb-/doVi4hWq0sqexPo_ylKYxVIJdr9zz2VweWbcY7x70kRnbVNPvBaoTsjwfOq1uojOtsRKJ8r3372HRaTOVg4VyKOFFvzjq2EeMdpleIIyTv0tb-C3CzXmkZz-34hK4Fc-r4mZK55L9W1RqJMpsvrORZr_sqpqvGZrrRq830get0NLJGkeAQ9SBg/' + ts
  ts_content = requests.get(url=ts_url).content

保存數(shù)據(jù)

with open('霸王別姬.mp4', mode='ab') as f:
  f.write(ts_content)
print('下載完成')

運(yùn)行代碼

Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式

到此這篇關(guān)于Python爬蟲小練習(xí)之爬取并分析騰訊視頻m3u8格式的文章就介紹到這了,更多相關(guān)Python爬取騰訊視頻內(nèi)容請(qǐng)搜索服務(wù)器之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持服務(wù)器之家!

原文鏈接:https://blog.csdn.net/m0_48405781/article/details/120725068

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 暖暖的免费观看高清视频韩国 | 91aaa在线观看 | 亚洲精品一区二区三区在线观看 | gay小太正初精 | 18无删减羞羞网站动漫 | 俄罗斯12一15处交 | 精品视频一区二区三区 | 久久学生精品国产自在拍 | 太紧太深了受不了黑人 | 大学生初次破苞免费视频 | 欧美日韩中文国产一区二区三区 | 久久国产精品高清一区二区三区 | 国产情侣视频观看 | 国产码一区二区三区 | 国产女主播在线播放一区二区 | 欧美日韩人成在线观看 | 人禽l交免费视频观看+视频 | 护士让我吃奶我扒她奶 | 青青草成人在线观看 | 日本精品一二三区 | 三极片在线观看 | 国产自在自线午夜精品之la | 国产成人精品高清在线 | 国产极品久久 | 天美网站传媒入口网址 | 国产精品久久久久久吹潮 | 处女呦呦| 俄罗斯12一15处交 | 美女被吸乳得到大胸 | 日韩一区二区三区在线 | 黄色wwwwww| 范冰冰a级一级特级毛片 | 手机看片黄色 | 亚洲va欧美va国产综合久久 | 欧美成人福利 | 传说之下羊妈挤羊奶网站 | 万域之王动漫在线观看全集免费播放 | 亚洲ⅴa偷拍在线影院 | 极品ts赵恩静和直男激战啪啪 | 国内自拍成人网在线视频 | 日本精品一区二区在线播放 |