線程
線程(Thread
),有時(shí)也被稱為輕量級(jí)進(jìn)程(Lightweight Process,LWP
),是操作系統(tǒng)獨(dú)?調(diào)度和分派的基本單位,本質(zhì)上就是一串指令的集合。
?個(gè)標(biāo)準(zhǔn)的線程由線程id、當(dāng)前指令指針(PC),寄存器集合和堆棧組成,它是進(jìn)程中的?個(gè)實(shí)體,線程本身不擁有系統(tǒng)資源,只擁有?點(diǎn)?在運(yùn)?中必不可少的資源(如程序計(jì)數(shù)器、寄存器、棧),但它可與同屬?個(gè)進(jìn)程的其它線程共享進(jìn)程所擁有的全部資源。線程不能夠獨(dú)?執(zhí)?,必須依存在進(jìn)程中。
多線程
多線程就是使用多個(gè)線程同時(shí)執(zhí)行任務(wù),實(shí)現(xiàn)了任務(wù)的并行執(zhí)行,從而提高程序運(yùn)行效率的方法。
試想一下,如果在單個(gè)線程內(nèi)執(zhí)行多個(gè)任務(wù)(比如發(fā)送網(wǎng)絡(luò)請(qǐng)求等),如果前面的任務(wù)比較耗時(shí),而后面的任務(wù)需要等待前面的任務(wù)執(zhí)行完才能執(zhí)行,這樣會(huì)影響任務(wù)執(zhí)行效率,那么就可以使用多線程去執(zhí)行這些任務(wù),任務(wù)可以同時(shí)進(jìn)行,那么將大大的提高執(zhí)行效率。
Python多線程
在Python中,提供了threading模塊來(lái)實(shí)現(xiàn)多進(jìn)程操作,這個(gè)模塊是基于較低級(jí)的模塊 _thread 的基礎(chǔ)上建立的,提供了更易用的高級(jí)多線程API。
創(chuàng)建線程
可以通過(guò)threading模塊中的Thread類來(lái)創(chuàng)建線程對(duì)象。
Thread語(yǔ)法結(jié)構(gòu):
threading.Thread(group, target, name, daemon)
-
group
:默認(rèn)為None(該參數(shù)是為了以后實(shí)現(xiàn)ThreadGroup類而保留的) -
target
:在run方法中調(diào)用的可調(diào)用對(duì)象,即線程要執(zhí)行的任務(wù) -
name
:線程名稱,可以不設(shè)定,默認(rèn)為"Thread-N"形式的名稱 -
args
:給target指定的函數(shù)傳遞的參數(shù),以元組的?式傳遞 -
kwargs
:給target指定的函數(shù)傳遞命名參數(shù) -
daemon
:默認(rèn)為None,將顯式地設(shè)置該線程是否為守護(hù)模式。如果是None,線程將繼承當(dāng)前線程的守護(hù)模式屬性
Thread常用方法
-
start()
:?jiǎn)?dòng)線程,并調(diào)用該線程中的run()方法 -
run()
:線程啟動(dòng)時(shí)運(yùn)行的方法,正是它去調(diào)用target指定的函數(shù) -
join(timeout=None)
:讓當(dāng)前調(diào)用者線程(一般為主線程)等待,直到該線程結(jié)束,timeout是可選的超時(shí)時(shí)間 -
is_alive()
:返回當(dāng)前線程是否存活
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
import threading import time def work(i): print ( "子線程'{}'work正在運(yùn)行......" . format (threading.current_thread().name)) time.sleep(i) print ( "子線程'{}'運(yùn)行結(jié)束......" . format (threading.current_thread().name)) if __name__ = = '__main__' : print ( "主線程{}啟動(dòng)" . format (threading.current_thread().name)) # 獲取線程的名稱 threads = [] for i in range ( 5 ): t = threading.Thread(target = work, args = (i,)) # 啟動(dòng)線程 threads.append(t) t.start() for t in threads: t.join() print ( "主線程結(jié)束" ) |
執(zhí)行結(jié)果為:
上述代碼中使用t.join()的功能就是讓主線程等待所有子線程結(jié)束后才結(jié)束,如果想設(shè)置守護(hù)線程(主線程結(jié)束,子線程也隨之結(jié)束,無(wú)論任務(wù)執(zhí)行完成與否)的話,可以使用t.daemon = True
。
GIL鎖
GIL的全稱是Global Interpreter Lock
(全局解釋器鎖),這個(gè)鎖最初的設(shè)計(jì)是為了保證同一份數(shù)據(jù)不能被多個(gè)線程同時(shí)修改,每個(gè)線程在執(zhí)行任務(wù)的時(shí)候都需要先獲取GIL,保證同一時(shí)刻只有一個(gè)線程可以執(zhí)行,即同一時(shí)刻只有一個(gè)線程在解釋器中運(yùn)行,因此Python中的多線程是假的多線程,不是真正意義上的多線程。 如果程序中有多個(gè)線程執(zhí)行任務(wù),那么多個(gè)線程會(huì)被解釋器輪流執(zhí)行,只不過(guò)是切換的很快、很頻繁,給人一種多線程“同時(shí)”在執(zhí)行的錯(cuò)覺(jué)。
線程池
在之前的文章說(shuō)過(guò),進(jìn)程有進(jìn)程池的機(jī)制,同樣,線程也有線程池。線程池可以在程序啟動(dòng)時(shí)就創(chuàng)建自定義數(shù)量的空閑的線程,程序只要將一個(gè)任務(wù)提交給線程池,線程池就會(huì)啟動(dòng)一個(gè)空閑的線程來(lái)執(zhí)行它。當(dāng)該任務(wù)執(zhí)行結(jié)束后,該線程并不會(huì)死亡,而是再次返回到線程池中變成空閑狀態(tài),等待下一個(gè)任務(wù)的執(zhí)行。
multiprocessing.dummy
里面也有一個(gè)Pool對(duì)象,它其實(shí)就是線程的封裝,使用起來(lái)和multiprocessing
的Pool非常類似。它們api都是通用的,簡(jiǎn)單地說(shuō),multiprocessing.dummy
是multiprocessing
進(jìn)程池模塊復(fù)制的一個(gè)線程池模塊,強(qiáng)調(diào)一下,這里線程池也是受到GIL限制的。
使用方式和multiprocessing.Pool一致,具體參考Python進(jìn)程池。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
from multiprocessing.dummy import Pool import time def work(i): print ( "work'{}'執(zhí)行中......" . format (i)) time.sleep( 2 ) print ( "work'{}'執(zhí)行完畢......" . format (i)) if __name__ = = '__main__' : # 創(chuàng)建線程池 # Pool(5) 表示創(chuàng)建容量為5個(gè)線程的線程池 pool = Pool( 5 ) for i in range ( 10 ): pool.apply_async(work, (i, )) pool.close() pool.join() |
總結(jié)
由于Python中的多線程受GIL鎖的限制,導(dǎo)致不能利用機(jī)器多核的特性,只能利用單核,是假的多線程,但是也不是一無(wú)是處,對(duì)于IO密集型任務(wù),多線程是能夠有效提升運(yùn)行效率的,這是因?yàn)閱尉€程下有IO操作時(shí),會(huì)進(jìn)行IO等待,這樣會(huì)浪費(fèi)等待的這段時(shí)間,而開(kāi)啟多線程能在線程A等待時(shí),自動(dòng)切換到線程B,可以減少不必要的時(shí)間浪費(fèi),從而能提升程序運(yùn)行效率,但是也不是最好的選擇,對(duì)于處理IO密集型任務(wù),在Python還有更好的選擇協(xié)程,在后續(xù)文章會(huì)介紹。
本篇文章就到這里了,希望能夠給你帶來(lái)幫助,也希望您能夠多多關(guān)注服務(wù)器之家的更多內(nèi)容!
原文鏈接:https://blog.csdn.net/weixin_50097774/article/details/121443474