不論你是否關(guān)注,Java Web應(yīng)用都或多或少的使用了線程池來(lái)處理請(qǐng)求。線程池的實(shí)現(xiàn)細(xì)節(jié)可能會(huì)被忽視,但是有關(guān)于線程池的使用和調(diào)優(yōu)遲早是需要了解的。本文主要介紹Java線程池的使用和如何正確的配置線程池。
單線程
我們先從基礎(chǔ)開(kāi)始。無(wú)論使用哪種應(yīng)用服務(wù)器或者框架(如Tomcat、Jetty等),他們都有類(lèi)似的基礎(chǔ)實(shí)現(xiàn)。Web服務(wù)的基礎(chǔ)是套接字(socket),套接字負(fù)責(zé)監(jiān)聽(tīng)端口,等待TCP連接,并接受TCP連接。一旦TCP連接被接受,即可從新創(chuàng)建的TCP連接中讀取和發(fā)送數(shù)據(jù)。
為了能夠理解上述流程,我們不直接使用任何應(yīng)用服務(wù)器,而是從零開(kāi)始構(gòu)建一個(gè)簡(jiǎn)單的Web服務(wù)。該服務(wù)是大部分應(yīng)用服務(wù)器的縮影。一個(gè)簡(jiǎn)單的單線程Web服務(wù)大概是這樣的:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
ServerSocket listener = new ServerSocket( 8080 ); try { while ( true ) { Socket socket = listener.accept(); try { handleRequest(socket); } catch (IOException e) { e.printStackTrace(); } } } finally { listener.close(); } |
上述代碼創(chuàng)建了一個(gè) 服務(wù)端套接字(ServerSocket) ,監(jiān)聽(tīng)8080端口,然后循環(huán)檢查這個(gè)套接字,查看是否有新的連接。一旦有新的連接被接受,這個(gè)套接字會(huì)被傳入handleRequest方法。這個(gè)方法會(huì)將數(shù)據(jù)流解析成HTTP請(qǐng)求,進(jìn)行響應(yīng),并寫(xiě)入響應(yīng)數(shù)據(jù)。在這個(gè)簡(jiǎn)單的示例中,handleRequest方法僅僅實(shí)現(xiàn)數(shù)據(jù)流的讀入,返回一個(gè)簡(jiǎn)單的響應(yīng)數(shù)據(jù)。在通常實(shí)現(xiàn)中,該方法還會(huì)復(fù)雜的多,比如從數(shù)據(jù)庫(kù)讀取數(shù)據(jù)等。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
final static String response = “HTTP/ 1.0 200 OK/r/n” + “Content-type: text/plain/r/n” + “/r/n” + “Hello World/r/n”; public static void handleRequest(Socket socket) throws IOException { // Read the input stream, and return “200 OK” try { BufferedReader in = new BufferedReader( new InputStreamReader(socket.getInputStream())); log.info(in.readLine()); OutputStream out = socket.getOutputStream(); out.write(response.getBytes(StandardCharsets.UTF_8)); } finally { socket.close(); } } |
由于只有一個(gè)線程來(lái)處理請(qǐng)求,每個(gè)請(qǐng)求都必須等待前一個(gè)請(qǐng)求處理完成之后才能夠被響應(yīng)。假設(shè)一個(gè)請(qǐng)求響應(yīng)時(shí)間為100毫秒,那么這個(gè)服務(wù)器的每秒響應(yīng)數(shù)(tps)只有10。
多線程
雖然handleRequest方法可能阻塞在IO上,但是CPU仍然可以處理更多的請(qǐng)求。但是在單線程情況下,這是無(wú)法做到的。因此,可以通過(guò)創(chuàng)建多線程的方式,來(lái)提升服務(wù)器的并行處理能力。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
public static class HandleRequestRunnable implements Runnable { final Socket socket; public HandleRequestRunnable(Socket socket) { this .socket = socket; } public void run() { try { handleRequest(socket); } catch (IOException e) { e.printStackTrace(); } } } ServerSocket listener = new ServerSocket( 8080 ); try { while ( true ) { Socket socket = listener.accept(); new Thread( new HandleRequestRunnable(socket)).start(); } } finally { listener.close(); } |
這里,accept()方法仍然在主線程中調(diào)用,但是一旦TCP連接建立之后,將會(huì)創(chuàng)建一個(gè)新的線程來(lái)處理新的請(qǐng)求,既在新的線程中執(zhí)行前文中的handleRequest方法。
通過(guò)創(chuàng)建新的線程,主線程可以繼續(xù)接受新的TCP連接,且這些信求可以并行的處理。這個(gè)方式稱(chēng)為“每個(gè)請(qǐng)求一個(gè)線程(thread per request)”。當(dāng)然,還有其他方式來(lái)提高處理性能,例如 NGINX 和 Node.js 使用的異步事件驅(qū)動(dòng)模型,但是它們不使用線程池,因此不在本文的討論范圍。
在每個(gè)請(qǐng)求一個(gè)線程實(shí)現(xiàn)中,創(chuàng)建一個(gè)線程(和后續(xù)的銷(xiāo)毀)開(kāi)銷(xiāo)是非常昂貴的,因?yàn)镴VM和操作系統(tǒng)都需要分配資源。另外,上面的實(shí)現(xiàn)還有一個(gè)問(wèn)題,即創(chuàng)建的線程數(shù)是不可控的,這將可能導(dǎo)致系統(tǒng)資源被迅速耗盡。
資源耗盡
每個(gè)線程都需要一定的棧內(nèi)存空間。在最近的64位JVM中, 默認(rèn)的棧大小 是1024KB。如果服務(wù)器收到大量請(qǐng)求,或者h(yuǎn)andleRequest方法執(zhí)行很慢,服務(wù)器可能因?yàn)閯?chuàng)建了大量線程而崩潰。例如有1000個(gè)并行的請(qǐng)求,創(chuàng)建出來(lái)的1000個(gè)線程需要使用1GB的JVM內(nèi)存作為線程棧空間。另外,每個(gè)線程代碼執(zhí)行過(guò)程中創(chuàng)建的對(duì)象,還可能會(huì)在堆上創(chuàng)建對(duì)象。這樣的情況惡化下去,將會(huì)超出JVM堆內(nèi)存,并產(chǎn)生大量的垃圾回收操作,最終引發(fā) 內(nèi)存溢出(OutOfMemoryErrors) 。
這些線程不僅僅會(huì)消耗內(nèi)存,它們還會(huì)使用其他有限的資源,例如文件句柄、數(shù)據(jù)庫(kù)連接等。不可控的創(chuàng)建線程,還可能引發(fā)其他類(lèi)型的錯(cuò)誤和崩潰。因此,避免資源耗盡的一個(gè)重要方式,就是避免不可控的數(shù)據(jù)結(jié)構(gòu)。
順便說(shuō)下,由于線程棧大小引發(fā)的內(nèi)存問(wèn)題,可以通過(guò)-Xss開(kāi)關(guān)來(lái)調(diào)整棧大小??s小線程棧大小之后,可以減少每個(gè)線程的開(kāi)銷(xiāo),但是可能會(huì)引發(fā) 棧溢出(StackOverflowErrors) 。對(duì)于一般應(yīng)用程序而言,默認(rèn)的1024KB過(guò)于富裕,調(diào)小為256KB或者512KB可能更為合適。Java允許的最小值是160KB。
線程池
為了避免持續(xù)創(chuàng)建新線程,可以通過(guò)使用簡(jiǎn)單的線程池來(lái)限定線程池的上限。線程池會(huì)管理所有線程,如果線程數(shù)還沒(méi)有達(dá)到上限,線程池會(huì)創(chuàng)建線程到上限,且盡可能復(fù)用空閑的線程。
1
2
3
4
5
6
7
8
9
10
|
ServerSocket listener = new ServerSocket( 8080 ); ExecutorService executor = Executors.newFixedThreadPool( 4 ); try { while ( true ) { Socket socket = listener.accept(); executor.submit( new HandleRequestRunnable(socket) ); } } finally { listener.close(); } |
在這個(gè)示例中,沒(méi)有直接創(chuàng)建線程,而是使用了ExecutorService。它將需要執(zhí)行的任務(wù)(需要實(shí)現(xiàn)Runnables接口)提交到線程池,使用線程池中的線程執(zhí)行代碼。示例中,使用線程數(shù)量為4的固定大小線程池來(lái)處理所有請(qǐng)求。這限制了處理請(qǐng)求的線程數(shù)量,也限制了資源的使用。
除了通過(guò) newFixedThreadPool 方法創(chuàng)建固定大小線程池,Executors類(lèi)還提供了 newCachedThreadPool 方法。復(fù)用線程池還是有可能導(dǎo)致不可控的線程數(shù),但是它會(huì)盡可能使用之前已經(jīng)創(chuàng)建的空閑線程。通常該類(lèi)型線程池適合使用在不會(huì)被外部資源阻塞的短任務(wù)上。
工作隊(duì)列
使用了固定大小線程池之后,如果所有的線程都繁忙,再新來(lái)一個(gè)請(qǐng)求將會(huì)發(fā)生什么呢?ThreadPoolExecutor使用一個(gè)隊(duì)列來(lái)保存等待處理的請(qǐng)求,固定大小線程池默認(rèn)使用無(wú)限制的鏈表。注意,這又可能引起資源耗盡問(wèn)題,但只要線程處理的速度大于隊(duì)列增長(zhǎng)的速度就不會(huì)發(fā)生。然后前面示例中,每個(gè)排隊(duì)的請(qǐng)求都會(huì)持有套接字,在一些操作系統(tǒng)中,這將會(huì)消耗文件句柄。由于操作系統(tǒng)會(huì)限制進(jìn)程打開(kāi)的文件句柄數(shù),因此最好限制下工作隊(duì)列的大小。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
public static ExecutorService newBoundedFixedThreadPool( int nThreads, int capacity) { return new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>(capacity), new ThreadPoolExecutor.DiscardPolicy()); } public static void boundedThreadPoolServerSocket() throws IOException { ServerSocket listener = new ServerSocket( 8080 ); ExecutorService executor = newBoundedFixedThreadPool( 4 , 16 ); try { while ( true ) { Socket socket = listener.accept(); executor.submit( new HandleRequestRunnable(socket) ); } } finally { listener.close(); } } |
這里我們沒(méi)有直接使用Executors.newFixedThreadPool方法來(lái)創(chuàng)建線程池,而是自己構(gòu)建了ThreadPoolExecutor對(duì)象,并將工作隊(duì)列長(zhǎng)度限制為16個(gè)元素。
如果所有的線程都繁忙,新的任務(wù)將會(huì)填充到隊(duì)列中,由于隊(duì)列限制了大小為16個(gè)元素,如果超過(guò)這個(gè)限制,就需要由構(gòu)造ThreadPoolExecutor對(duì)象時(shí)的最后一個(gè)參數(shù)來(lái)處理了。示例中,使用了 拋棄策略(DiscardPolicy) ,即當(dāng)隊(duì)列到達(dá)上限時(shí),將拋棄新來(lái)的任務(wù)。初次之外,還有 中止策略(AbortPolicy) 和 調(diào)用者執(zhí)行策略(CallerRunsPolicy) 。前者將拋出一個(gè)異常,而后者會(huì)再調(diào)用者線程中執(zhí)行任務(wù)。
對(duì)于Web應(yīng)用來(lái)說(shuō),最優(yōu)的默認(rèn)策略應(yīng)該是拋棄或者中止策略,并返回一個(gè)錯(cuò)誤給客戶端(如 HTTP 503 錯(cuò)誤)。當(dāng)然也可以通過(guò)增加工作隊(duì)列長(zhǎng)度的方式,避免拋棄客戶端請(qǐng)求,但是用戶請(qǐng)求一般不愿意進(jìn)行長(zhǎng)時(shí)間的等待,且這樣會(huì)更多的消耗服務(wù)器資源。工作隊(duì)列的用途,不是無(wú)限制的響應(yīng)客戶端請(qǐng)求,而是平滑突發(fā)暴增的請(qǐng)求。通常情況下,工作隊(duì)列應(yīng)該是空的。
線程數(shù)調(diào)優(yōu)
前面的示例展示了如何創(chuàng)建和使用線程池,但是,使用線程池的核心問(wèn)題在于應(yīng)該使用多少線程。首先,我們要確保達(dá)到線程上限時(shí),不會(huì)引起資源耗盡。這里的資源包括內(nèi)存(堆和棧)、打開(kāi)文件句柄數(shù)量、TCP連接數(shù)、遠(yuǎn)程數(shù)據(jù)庫(kù)連接數(shù)和其他有限的資源。特別的,如果線程任務(wù)是計(jì)算密集型的,CPU核心數(shù)量也是資源限制之一,一般情況下線程數(shù)量不要超過(guò)CPU核心數(shù)量。
由于線程數(shù)的選定依賴(lài)于應(yīng)用程序的類(lèi)型,可能需要經(jīng)過(guò)大量性能測(cè)試之后,才能得出最優(yōu)的結(jié)果。當(dāng)然,也可以通過(guò)增加資源數(shù)的方式,來(lái)提升應(yīng)用程序的性能。例如,修改JVM堆內(nèi)存大小,或者修改操作系統(tǒng)的文件句柄上限等。然后,這些調(diào)整最終還是會(huì)觸及理論上限。
利特爾法則
利特爾法則 描述了在穩(wěn)定系統(tǒng)中,三個(gè)變量之間的關(guān)系。
其中L表示平均請(qǐng)求數(shù)量,λ表示請(qǐng)求的頻率,W表示響應(yīng)請(qǐng)求的平均時(shí)間。舉例來(lái)說(shuō),如果每秒請(qǐng)求數(shù)為10次,每個(gè)請(qǐng)求處理時(shí)間為1秒,那么在任何時(shí)刻都有10個(gè)請(qǐng)求正在被處理?;氐轿覀兊脑掝},就是需要使用10個(gè)線程來(lái)進(jìn)行處理。如果單個(gè)請(qǐng)求的處理時(shí)間翻倍,那么處理的線程數(shù)也要翻倍,變成20個(gè)。
理解了處理時(shí)間對(duì)于請(qǐng)求處理效率的影響之后,我們會(huì)發(fā)現(xiàn),通常理論上限可能不是線程池大小的最佳值。線程池上限還需要參考任務(wù)處理時(shí)間。
假設(shè)JVM可以并行處理1000個(gè)任務(wù),如果每個(gè)請(qǐng)求處理時(shí)間不超過(guò)30秒,那么在最壞情況下,每秒最多只能處理33.3個(gè)請(qǐng)求。然而,如果每個(gè)請(qǐng)求只需要500毫秒,那么應(yīng)用程序每秒可以處理2000個(gè)請(qǐng)求。
拆分線程池
在微服務(wù)或者面向服務(wù)架構(gòu)(SOA)中,通常需要訪問(wèn)多個(gè)后端服務(wù)。如果其中一個(gè)服務(wù)性能下降,可能會(huì)引起線程池線程耗盡,從而影響對(duì)其他服務(wù)的請(qǐng)求。
應(yīng)對(duì)后端服務(wù)失效的有效辦法是隔離每個(gè)服務(wù)所使用的線程池。在這種模式下,仍然有一個(gè)分派的線程池,將任務(wù)分派到不同的后端請(qǐng)求線程池中。該線程池可能因?yàn)橐粋€(gè)緩慢的后端而沒(méi)有負(fù)載,而將負(fù)擔(dān)轉(zhuǎn)移到了請(qǐng)求緩慢后端的線程池中。
另外,多線程池模式還需要避免死鎖問(wèn)題。如果每個(gè)線程都阻塞在等待未被處理請(qǐng)求的結(jié)果上時(shí),就會(huì)發(fā)生死鎖。因此,多線程池模式下,需要了解每個(gè)線程池執(zhí)行的任務(wù)和它們之間的依賴(lài),這樣可以盡可能避免死鎖問(wèn)題。
總結(jié)
即使沒(méi)有在應(yīng)用程序中直接使用線程池,它們也很有可能在應(yīng)用程序中被應(yīng)用服務(wù)器或者框架間接使用。 Tomcat 、 JBoss 、 Undertow 、 Dropwizard 等框架,都提供了調(diào)優(yōu)線程池(servlet執(zhí)行使用的線程池)的選項(xiàng)。
希望本文能夠提升對(duì)線程池的了解,對(duì)大家學(xué)習(xí)有所幫助。