當配置Linux內(nèi)核的時候,我們可以選擇一些參數(shù),這些參數(shù)能影響系統(tǒng)的行為。你可以用不同的優(yōu)先級、調(diào)度類和搶占模型來工作。正確地選擇這些參數(shù)是非常重要的。
本文將論述不同的搶占模型如何影響用戶和系統(tǒng)的行為。
當你使用 make menuconfig配置內(nèi)核的時候,你能看到這樣的菜單:
為了深入理解這三個搶占模型的區(qū)別,我們將寫一個案例:
2個線程,一個高優(yōu)先級RT(50),一個低優(yōu)先級RT(30)
高優(yōu)先級的線程要睡眠3秒
低優(yōu)先級的線程用CPU來做計算
3秒后高優(yōu)先級線程喚醒。
如果低優(yōu)先級的線程陷入系統(tǒng)調(diào)用,高優(yōu)先級的線程睡眠到期,究竟會發(fā)生什么?下面我們來一種模型一種模型地看。
No Forced Preemption
這種情況下,上下文切換發(fā)生在系統(tǒng)調(diào)用返回用戶空間的點。案例如下:
2個線程,一個高優(yōu)先級RT(50),一個低優(yōu)先級RT(30)
高優(yōu)先級的線程要睡眠3秒
低優(yōu)先級的線程進入系統(tǒng)調(diào)用計算5秒
5秒后低優(yōu)先級線程從內(nèi)核系統(tǒng)調(diào)用返回
高優(yōu)先級線程將醒來(但是比預(yù)期遲了2秒)。
內(nèi)核代碼,簡單的字符設(shè)備:
#include
讀里面delay了5秒, 注意mdelay是一個計算型的busy-loop。
用戶空間代碼如下:
#include
實驗步驟:
高優(yōu)先級線程開始睡眠3秒
低優(yōu)先級線程睡眠1秒然后做系統(tǒng)調(diào)用
高優(yōu)先級線程6秒后醒來(stop和start的時間差)
# insmod demo.ko # ./appthread1 start time=182thread2 startthread1 stop time=188thread2 stopend test
Preemptible Kernel
這種情況內(nèi)核里面也可以搶占,意味著上述程序里面的高優(yōu)先級線程3秒后可醒來。
這種情況下,系統(tǒng)會有更多的上下文切換,但是實時性更加好。對于要求軟實時的嵌入式系統(tǒng)而言,這個選項是最佳的。但是對于服務(wù)器而言,通常第一個選項更好——更少的上下文切換,更多的CPU時間用作有用功。
運行結(jié)果(stop、start時間差3秒):
# insmod ./demo.ko#./appthread1 start time=234thread2 startthread1 stop time=237thread2 stopend test
Voluntary Kernel Preemption
這種情況和第一種情況"no forced preemption"類似,但是內(nèi)核開發(fā)者可以在進行復(fù)雜操作的時候,時不時檢查一下是否可以reschedule。他們可以調(diào)用might_resched()函數(shù)。
在下面的代碼中,我們添加了一些檢查點(check point)
// callback for read system call on the devicestatic ssize_t my_read(struct file *file, char __user *buf,size_t count,loff_t *ppos){ int len=5; if(*ppos > 0) { return 0; } mdelay(4000); // busy-wait for 4 seconds might_resched(); delay(3000); // busy wait for 3 seconds if (copy_to_user(buf , "hello" , len)) { return -EFAULT; } else { *ppos +=len; return len; }}
如果我們把might_resched()注釋掉,它會delay 7秒。
添加cond_resched()調(diào)用將導(dǎo)致系統(tǒng)檢查是否有高優(yōu)先級的任務(wù)被喚醒,這樣高優(yōu)先級任務(wù)5秒可以醒來(其中1秒在systemcall之前,另外4秒在kernel)。
運行結(jié)果:
#insmod./demo.ko#./appthread1 start time=320thread2 startthread1 stop time=325thread2 stopend test
Full Real Time Preemption
如果我們使能RT補丁,我們會得到一個硬實時的kernel。這意味著任何代碼可以搶占任何人。比如一個更加緊急的任務(wù)可以搶占中斷服務(wù)程序ISR。這個patch進行了如下改動:
把中斷服務(wù)程序轉(zhuǎn)化為優(yōu)先級是50的RT線程
把softIRQ轉(zhuǎn)化為優(yōu)先級是49的RT線程
把所有的spinlock變成mutex
其他的細小改動
打補丁后會看到2個新增的菜單:
其中“Preemptible Kernel (Basic RT)” 是為了調(diào)試目的的,為了全面使用RT補丁的功能,我們應(yīng)該選擇最后一項 – Fully Preemptible Kernel。這樣我們會有更多的上下文切換,但是可以滿足RT的實時要求。
-
內(nèi)核
+關(guān)注
關(guān)注
3文章
1382瀏覽量
40372 -
Linux
+關(guān)注
關(guān)注
87文章
11341瀏覽量
210133
原文標題:理解Linux內(nèi)核搶占模型(最透徹一篇)
文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論