最近閱讀了JDK線程池ThreadPoolExecutor的源碼,對線程池執行任務的流程有了大體了解,實際上這個流程也十分通俗易懂,就不再贅述了,別人寫的比我好多了。
不過,我倒是對線程池是如何回收工作線程比較感興趣,所以簡單分析了一下,加深對線程池的理解吧。
那么,就以JDK1.8為例分析吧。
1. runWorker(Worker w)
工作線程啟動后,就進入runWorker(Worker w)方法。
里面是一個while循環,循環判斷任務是否為空,若不為空,執行任務;若取不到任務,或發生異常,退出循環,執行processWorkerExit(w, completedAbruptly); 在這個方法里把工作線程移除掉。
取任務的來源有兩個,一個是firstTask,這個是工作線程第一次跑的時候執行的任務,最多只能執行一次,后面得從getTask()方法里取任務。看來,getTask()是關鍵,在不考慮異常的場景下,返回null,就表示退出循環,結束線程。下一步,就得看看,什么情況下getTask()會返回null。
篇幅有限,分段截取,省略中間執行任務的步驟
2. getTask() 返回null
一共有兩種情況會返回null,見紅框處 。
第一種情況,線程池的狀態已經是STOP,TIDYING, TERMINATED,或者是SHUTDOWN且工作隊列為空;
第二種情況,工作線程數已經大于最大線程數或當前工作線程已超時,且,還有其他工作線程或任務隊列為空。這點比較難理解,總之先記住,后面會用。
下面以條件1和條件2分別指代這兩種情況的判斷條件。
3. 分場景分析線程池回收工作線程
3.1 未調用shutdown() ,RUNNING狀態下全部任務執行完成的場景
這種場景,會將工作線程的數量減少到核心線程數大小(如果本來就沒有超過,則不需要回收)。
比如一個線程池,核心線程數為4,最大線程數為8。一開始是4個工作線程,當任務把任務隊列塞滿,就得將工作線程增加到8. 當后面任務執行到差不多了,線程取不到任務了,就會回收到4個工作線程的狀態(取決于allowCoreThreadTimeOut的值,這里討論默認值false的情況,即核心線程不會超時。如果為true,工作線程可以全部銷毀)。
可以先排除上面提到的條件1,線程池的狀態已經是STOP,TIDYING, TERMINATED,或者是SHUTDOWN且工作隊列為空。因為線程池一直是RUNNING,這條判斷永遠是false。在這個場景中,可以當條件1不存在。
下面分析取不出任務時線程是怎么運行的。
step1. 從任務隊列取任務有兩種方式,超時等待還是可以一直阻塞下去。決定因素是timed變量。該變量在前面賦值,如果當前線程數大于核心線程數,變量timed為true, 否則為false(上面說了,這里只討論allowCoreThreadTimeOut為false的情況)。很明顯,現在討論的是timed為true的情況。keepAliveTime一般不設置,默認值為0,所以基本上可以認為是不阻塞,馬上返回取任務的結果。
在線程超時等待喚醒之后,發現取不出任務,timeOut變為true,進入下一次循環。
step2. 來到條件1的判斷,線程池一直RUNNING, 不進入代碼塊。
step3. 來到條件2的判斷,這時任務隊列為空,條件成立,CAS減少線程數,若成功,返回null,否則,重復step1。
這里要注意,有可能多條線程同時通過條件2的判斷,那會不會減少后線程的數量反而比預想的核心線程數少呢?
比如當前線程數已經只有5條了,此時有兩條線程同時喚醒,通過條件2的判斷,同時減少數量,那剩下的線程數反而只有3條,和預期不一致。
實際上是不會的。為了防止這種情況,compareAndDecrementWorkerCount(c) 用的是CAS方法,如果CAS失敗就continue,進入下一輪循環,重新判斷。
像上述例子,其中一條線程會CAS失敗,然后重新進入循環,發現工作線程數已經只有4了,timed為false, 這條線程就不會被銷毀,可以一直阻塞了(workQueue.take())。
這一點我思考了很久才得出答案,一直在想沒有加鎖的情況下是怎么保證一定能不多不少回收到核心線程數的呢。原來是CAS的奧妙。
從這里也可以看出,雖然有核心線程數,但線程并沒有區分是核心還是非核心,并不是先創建的就是核心,超過核心線程數后創建的就是非核心,最終保留哪些線程,完全隨機。
3.2 調用shutdown() ,全部任務執行完成的場景
這種場景,無論是核心線程還是非核心線程,所有工作線程都會被銷毀。
在調用shutdown()之后,會向所有的空閑工作線程發送中斷信號。
最終傳入false,調用下面這個方法。
可以看出,在發出中斷信號前,會判斷是否已經中斷,以及要獲得工作線程的獨占鎖。
發出中斷信號的時候,工作線程要么在getTask()里準備獲取任務,要么在執行任務,那就得等它執行完當前任務才會發出,因為工作線程在執行任務的時候,也會工作線程加鎖。工作線程執行完任務,又跑到getTask()里面去了。
所以我們只要看getTask()里面怎么應對中斷異常的就可以了。
工作線程在getTask()里,有兩種可能。
3.2.1 任務已全部完成,線程在阻塞等待。
很簡單,中斷信號將其喚醒,從而進入下一輪循環。到達條件1處,符合條件,減少工作線程數量,并返回null,由外層結束這條線程。
這里的decrementWorkerCount()是自旋式的,一定會減1。
3.2.2 任務還沒有完全執行完
調用shutdown()之后,未執行完的任務要執行完畢,池子才能結束。所以此時有可能線程還在工作。
這里又要分兩個階段討論
階段1 任務較多,工作線程都能獲得任務
這里還不涉及到線程退出,可以跳過不看,只是分析一下收到中斷信號后線程的表現。
假設有線程A,正通過getTask()里獲取任務。此時A被中斷,在獲取任務時,無論是poll()還是take(),都會拋出中斷異常。異常被捕獲,重新進入下一輪循環,只要隊列不為空,就可以繼續取任務。
線程A被中斷,再次取任務,調用workQueue.poll() or workQueue.take(),不會拋出異常嗎?還可以正常取出任務嗎?
這就要看workQueue的實現了。workQueue是BlockingQueue類型,以常見的LinkedBlockingQueue和ArrayBlockingQueue為例,加鎖時都是調用lockInterruptibly(),是響應中斷的。該方法又調用了AQS的acquireInterruptibly(int arg)。
acquireInterruptibly(int arg),無論是在入口處判斷中斷異常,還是在parkAndCheckInterrupt()方法阻塞,被中斷喚醒并判斷中斷異常時,均使用了Thread.interrupted()。這個方法會返回線程的中斷狀態,并把中斷狀態重置!也就是說,線程不再是中斷狀態了,這樣在再次取任務時,就不會報錯了。
因此,這對于正在準備取任務的線程,只是相當于浪費了一次循環,這可能是線程中斷帶來的副作用吧,當然,對整體的運行不影響。
分析到這里,我不禁感嘆,這里BlockingQueue剛好是會重置中斷狀態,這到底是怎么想出來的絕妙設計啊?Doug Lea大神Orz。
階段2 任務剛好要執行完了
這時任務已經快取完了,比如有4條工作線程,只剩下2個任務,那就可能出現2條線程獲得任務,2條線程阻塞。
因為在獲取任務前的判斷,沒有加鎖,那么會不會出現,所有線程都通過了前面的校驗,來到workQueue獲取任務的地方,剛好任務隊列已經空了,線程全部阻塞了呢?因為shutdown() 已經執行完畢,無法再向線程發出中斷信號,從而線程一直在阻塞,無法被回收。
這種是不會發生的。
假設有A,B,C,D四條工作線程,同時通過了條件1和條件2的判斷,來到取任務的地方。那么,工作隊列至少還有一個任務,至少會有一條線程能取到任務。
假設A,B獲得了任務,C,D阻塞。
A, B接下來的步驟是:
step1. 任務執行完成后,再次getTask(),此時符合條件1,返回null,線程準備被回收。
step2. processWorkerExit(Worker w, boolean completedAbruptly) 將線程回收。
回收就只是把線程干掉這么簡單嗎?來看看processWorkerExit(Worker w, boolean completedAbruptly) 的方法。
可以看到,在里面除了workers.remove(w) 移除線,還調用了tryTerminate()。
第一個判斷條件沒有一個子條件符合,跳過。第二個條件,工作線程還存在,那么隨機中斷一條空閑線程。
那么問題就來了,中斷一條空閑線程,也沒說是一定中斷正在阻塞的線程啊。如果A, B同時退出,有沒有可能出現A中斷B, B中斷A,AB互相中斷,從而沒有線程去中斷喚醒阻塞的線程呢?
答案仍然是,想多了……
假設A能走到這里,說明A已經從工作線程的集合workers里面移除了(processWorkerExit(Worker w, boolean completedAbruptly) 在tryTerminate()之前,已經將其移除)。那么A中斷B,B來到這里中斷,就不會在workers里面找到A了。
也就是說,退出的線程不能互相中斷,我從集合中退出后,中斷了你,你不能中斷我,因為我已經退出集合,你只能中斷別人。那么,即使有N個線程同時退出,至少在最后,也會有一條線程,會中斷剩余的阻塞線程。
就像多米諾骨牌一樣,中斷信號就會被傳播下去。
阻塞的C,D中的任意一條被中斷喚醒后,又會重復step1的動作,周而復始,直到所有阻塞線程都被中斷,喚醒。
這也是為什么在tryTerminate()里面,傳入false,只需要中斷任意一條空閑線程的原因。
想到這里,再次對Doug Lea心生欽敬(粵語)之情。這設計得也太妙了叭。
4. 總結
ThreadPoolExecutor回收工作線程,一條線程getTask()返回null,就會被回收。
分兩種場景。
1) 未調用shutdown() ,RUNNING狀態下全部任務執行完成的場景
線程數量大于corePoolSize,線程超時阻塞,超時喚醒后CAS減少工作線程數,如果CAS成功,返回null,線程回收。否則進入下一次循環。當工作者線程數量小于等于corePoolSize,就可以一直阻塞了。
2) 調用shutdown() ,全部任務執行完成的場景
shutdown() 會向所有線程發出中斷信號,這時有兩種可能。
2.1)所有線程都在阻塞
中斷喚醒,進入循環,都符合第一個if判斷條件,都返回null,所有線程回收。
2.2)任務還沒有完全執行完
至少會有一條線程被回收。在processWorkerExit(Worker w, boolean completedAbruptly)方法里會調用tryTerminate(),向任意空閑線程發出中斷信號。所有被阻塞的線程,最終都會被一個個喚醒,回收。
這一次的分析,昨晚開始寫,寫到一半卡殼,今天早上接著寫,前后花了大概2+2=4個小時寫博客以及1小時思考。
說實話自己還是有點亂,無法一下子理解透徹,也不知道自己理解得對不對。
有沒有用,我也不知道,只能說,加深了對線程池的理解吧(安慰自己),同時也感慨設計之精妙。
如有不正確的地方,請大家指正。
審核編輯:湯梓紅
-
源碼
+關注
關注
8文章
643瀏覽量
29256 -
線程池
+關注
關注
0文章
57瀏覽量
6861 -
JDK
+關注
關注
0文章
81瀏覽量
16600
原文標題:原理解析:線程池中多余的線程是如何回收的?
文章出處:【微信號:AndroidPush,微信公眾號:Android編程精選】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論