一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python爬蟲定時計劃任務的幾種常見方法(推薦)

Python爬蟲定時計劃任務的幾種常見方法(推薦)

2021-08-25 00:3051CTO Python

這篇文章主要介紹了Python爬蟲定時計劃任務的幾種常見方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下

記得以前的Windows任務定時是可以正常使用的,今天試了下,發現不能正常使用了,任務計劃總是掛起。接下來記錄下Python爬蟲定時任務的幾種解決方法。

1.方法一、while True

首先最容易的是while true死循環掛起,不廢話,直接上代碼:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
import os
import time
import sys
from datetime import datetime, timedelta
def One_Plan():
  # 設置啟動周期
  Second_update_time = 24 * 60 * 60
 # 當前時間
 now_Time = datetime.now()
 # 設置 任務啟動時間
 plan_Time = now_Time.replace(hour=9, minute=0, second=0, microsecond=0)
 # 設置差值,-1 day, 21:48:53.246576,類似于這樣
 # time.sleep()需要傳入int,所以下面使用.total_seconds()
 # 主要用來計算差值,返回int,具體功能可以自行查閱相關資料
 delta = plan_Time - now_Time
 first_plan_Time = delta.total_seconds() % Second_update_time
 print("距離第一次執行需要睡眠%d秒" % first_plan_Time)
 return first_plan_Time
# while Ture代碼塊,掛起程序,睡眠時間結束后調用函數名進行執行
while True:
 s1 = One_Plan()
 time.sleep(s1)
 # 下面這里是自己定義的函數,想跑代碼的可以換成hellow world函數或者注釋掉這行測試下
 exe_file(D_list)
 print("正在執行首次更新程序")

個人感覺使用這種方式進行定時計劃的啟動如果為單個程序,并且一天執行一次的話沒什么問題,如果要考慮到一天執行多個任務并且一天需要執行多次,短板一下就凸顯出來了。

在工作的情況中還需要考慮到很多因素,比如爬蟲程序需要在晚上12點和早上6點、9點,下午3點執行四次,并且需要同時執行4個爬蟲,還需要考慮到網絡是否穩定,如果程序掛掉該怎么處理等等因素。

2.方法二、Timer模塊

之前說了最簡單的定時啟動,可以說是最簡單粗暴的,人生苦短,python優雅,有沒有那種很簡單很簡單,幾行代碼就可以搞定的那種?必須有的哈!簡單舉個例子說一下,上一個方法的末尾提到過需要考慮到其他因素,這就來了:

現在需要啟動一個selenium的爬蟲,使用火狐驅動+多線程,大家都明白的,現在電腦管家顯示CPU占用率20%,啟動selenium后不停的開啟瀏覽器+多線程,好,沒過5分鐘,CPU占用率直接拉到90%+,電腦卡到飛起,定時程序雖然還在運行,但是已經類似于待機狀態,是不是突然感覺到面對電腦卡死,第一反應:臥槽,這個lj電腦,怎么程序都跑不起來,我還寫這么多代碼,*****??!

是吧,接下來上代碼,具體功能,請自行查閱相關資料深造:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from datetime import datetime
from threading import Timer
import time
# 定時任務
def task():
 print(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
def timedTask():
 '''
 第一個參數: 延遲多長時間執行任務(秒)
 第二個參數: 要執行的函數
 第三個參數: 調用函數的參數(tuple)
 '''
 Timer(5, task, ()).start()
while True:
 timedTask()
 time.sleep(5)

7行代碼,是不是很優雅?優不優雅的主要是代碼少,不費勁對吧。

2020-06-05 14:06:39 
2020-06-05 14:06:44 
2020-06-05 14:06:49 
2020-06-05 14:06:54 
2020-06-05 14:06:59 
2020-06-05 14:07:04 
2020-06-05 14:07:09 
2020-06-05 14:07:14 
2020-06-05 14:07:19 
2020-06-05 14:07:24

3. 方法三、sched模塊

這次直接上模塊——sched模塊

代碼如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
from datetime import datetime
import sched
import time
def timedTask():
 # 初始化 sched 模塊的 scheduler 類,傳入(time.time, time.sleep)這兩個參數
 schedscheduler = sched.scheduler(time.time, time.sleep)
 # 增加調度任務,enter(睡眠時間,執行級別,執行函數)
 scheduler.enter(5, 1, task)
 # 運行任務
 scheduler.run()
# 定時任務
def task():
 print(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
if __name__ == '__main__':
 timedTask()

這個模塊也很容易上手,需要注意,scheduler()只會執行一次就結束程序,可以在mian下面添加while Ture或者直接添加調度任務在timeTask中就可以,另外除了這樣的寫法外,還有另外一種寫法,上代碼:

?
1
2
3
4
5
6
7
8
9
10
11
import schedule
import time
def hellow():
 print('hellow')
def Timer():
 schedule.every().day.at("09:00").do(hellow)
 schedule.every().day.at("18:00").do(hellow)
 while True:
  schedule.run_pending()
  time.sleep('需要睡眠的周期')
Timer()

Python爬蟲定時計劃任務的幾種常見方法(推薦)

在這里可以看到,有day-hour-minute,定時任務非常的方便,在while True里添加需要睡眠的時間,在函數模塊內添加需要執行的次數即可。

到此這篇關于Python爬蟲定時計劃任務的幾種常見方法的文章就介紹到這了,更多相關Python爬蟲定時計劃任務內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!

原文鏈接:http://developer.51cto.com/art/202101/640900.htm

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 国产馆精品推荐在线观看 | 久久精品国产免费播放 | 国产99精品成人免费视频 | 91麻豆精品 | 免费看日产一区二区三区 | 久久精品国产在热亚洲 | 亚洲黑人巨大videos0 | 视频二区 素人 制服 国产 | 明星裸乳照无奶罩 | 国产欧美一区二区三区免费看 | 亚洲福利电影一区二区? | 高黄h文各种play | 幻女free性zoz0交 | yjsp妖精视频在线观看免费 | 短篇同学新婚h系列小说 | 免费精品视频在线 | 牧教师| 欧美日韩精品亚洲精品v18 | 精品久久久噜噜噜久久7 | 香蕉免费看一区二区三区 | 亚洲夜色夜色综合网站 | 精品久久久久久久久久久久久久久 | japaneseles女同专区 | asianfemdom冷柔女王 | 国产伦精品一区二区三区免 | 久久国产精品福利影集 | 色涩导航| 国产欧美国产综合第一区 | 插得好舒服| 5g影院天天5g天天爽大陆 | 欧美日韩亚洲区久久综合 | 大学生按摩黄a级中文片 | 国产亚洲成归v人片在线观看 | 91制片厂果冻传媒杨柳作品 | 韩国三级年轻小的胰子完整 | 东京道一本热大交乱 | www.四虎.com| 好大用力深一点视频 | a∨在线观看 | 亚洲欧美日韩国产精品影院 | 欧美日韩中文字幕在线视频 |