在linux多線程環(huán)境下對同一變量進行讀寫時,經(jīng)常會遇到讀寫的原子性問題,即會出現(xiàn)競爭條件。為了解決多個線程對同一變量訪問時的競爭條件問題,操作系統(tǒng)層面提供了鎖、信號量、條件變量等幾種線程同步機制。如果對變量的每次訪問都使用上述機制,由于系統(tǒng)調(diào)用會陷入內(nèi)核空間,需要頻繁的進行上下文切換,這就導致了程序的時間開銷比較大。
自然的,我們就想到,在多線程環(huán)境中,在某些情況下是否能減少甚至避免使用系統(tǒng)調(diào)用?答案是肯定的。
如果對多線程下的變量訪問進行分析,可以看到,線程對變量的訪問可以分為以下幾類:
- 一個線程寫,另一個線程讀,簡稱一寫一讀
- 多個線程寫,一個線程讀,簡稱多寫一讀
- 一個線程寫,多個線程讀,簡稱一寫多讀。
- 多個線程寫,多個線程讀,簡稱多寫多讀。
在linux 系統(tǒng)中,多個線程同時讀一個變量是不需要同步的,而多個線程同時寫一個變量或一個線程寫而其他線程讀某個變量,是需要同步的,可以總結為:”多讀不互斥,而讀寫和多寫互斥“。
由于多個線程對同一變量的讀不需要同步,因而一寫多讀和一寫一讀并無本質(zhì)區(qū)別,進而可以把多線程下對變量訪問依據(jù)是否需要同步而合并成如下三類:
- 一寫多讀
- 多寫一讀
- 多寫多讀
解決上面所有的互斥,都可以使用系統(tǒng)調(diào)用。上面已經(jīng)提到,在某些情況下我們是可以避免使用代價高昂的系統(tǒng)調(diào)用的。而“一寫多讀”就是這些特殊情況中的一種。
雙buffer “無鎖” 設計
使用系統(tǒng)調(diào)用進行同步的主要問題在于頻繁切換上下文耗時較長,而后臺系統(tǒng)的處理速度又是除正確性之外最為關鍵的指標。為提高系統(tǒng)的運行速度,我們可以使用用其他系統(tǒng)資源來換取時間的辦法,從而避免使用鎖之類系統(tǒng)調(diào)用。在這些方法中,最常見的就是用空間換取時間。
針對一寫多讀的情況,可以使用”雙 buffer“ 及共享指針機制來實現(xiàn)對同一變量高效訪問,同時又能保證不會出現(xiàn)競爭條件。這一實現(xiàn)的技術關鍵點在于以下兩個方面:
- 雙 buffer 的備份機制,避免了同時讀寫同一變量。雙buffer 就是指對于通常要被多個線程訪問的變量,再額外定義一個備份變量。由于是一寫多讀,寫線程只向備份變量中寫入,而所有的讀線程只需要訪問主變量本身即可。當寫進程對備份變量的寫操作完成后,會觸發(fā)主變量指針和備份變量指針的互換操作,即指針切換,從而將原變量和備份變量的身份進行互換,達到數(shù)據(jù)更新的目的。
- 共享指針 shared_ptr,由于其記錄了對變量的引用次數(shù),因而可以避免指針切換時的“訪問丟失”問題。
為了便于理解,本文使用 C++ 中的 map 類型變量作為示意,當然,本文的方法可以推廣到一寫多讀模式下任意數(shù)據(jù)類型的更新中。使用雙 buffer 的示意圖如下:
注意ptr 和 bak_ptr 都是整個map 的指針,上面藍色箭頭表示通過兩個指針訪問 map 中的元素,ptr 和bak_ptr 本身并不指向元素。
在系統(tǒng)啟動時,把兩個智能指針分別初始化為一個主map 和一個備份 map。之后把全部數(shù)據(jù)更新到主map中開始對外提供服務。當外部需要讀取數(shù)據(jù)時(多讀),全部通過主map 的智能指針 ptr 來實現(xiàn)。而數(shù)據(jù)的更新全部通過備份map 的指針bak_ptr 來實現(xiàn)。由此可以看出,由于使用了兩個map,即雙buffer,使得數(shù)據(jù)的讀和寫進行了分離,互不影響,不會出現(xiàn)競爭條件,避免了鎖的使用。
指針的切換
由于讀寫分離,雙buffer機制下的數(shù)據(jù)讀寫不會出現(xiàn)競爭條件。在備份map 中數(shù)據(jù)更新完成時,必然需要一種方式,使得新數(shù)據(jù)能被使用到。這里需要做的就是把主map和備份map 的共享指針指向的內(nèi)容互換,即ptr 和bak_ptr 指向的內(nèi)容互換。指針切換如下圖所示:
那么,在指針互換時,會出現(xiàn)什么問題呢?
在指針的切換過程中,會出現(xiàn)如下兩個問題:
- 由于對主map 的讀是多線程的讀,會出現(xiàn)多線程同使用主map 共享指針ptr 的情形,而互換指針時,需要對主map 的指針進行寫操作,那么對同一指針 ptr 的讀和寫的競爭條件如何解決?
- 在準備互換ptr 和 bak_ptr 指向的內(nèi)容時,如果某個讀線程正在使用 ptr 訪問主map,直接互換就可能出現(xiàn)讀線程再通過ptr獲取數(shù)據(jù)時訪問失效的問題,嚴重的情況下會訪問到無效內(nèi)存導致程序崩潰。這一問題本文簡稱為”指針訪問丟失“問題,類似于常規(guī)指針中出現(xiàn)的野指針或懸垂指針的問題。
ptr 競爭條件的解決
當指針切換時,單線程對 bak_ptr 的寫操作已經(jīng)完成,因而對其可以隨便讀寫。但由于多個讀線程可能還在使用ptr,切換指針時對 ptr 的讀寫就要十分的小心。為了避免對 ptr 的讀寫出現(xiàn)競爭條件,本文使用了自旋鎖來對ptr 的讀寫進行同步。使用自旋鎖的原因有兩個:
- 只在指針切換時使用鎖,而不是在讀寫兩個map 時使用鎖,因而鎖的使用頻率會非常的低,由此導致的上下文切換的代價是可接受的。
- 由于指針切換時 ptr 處于的情形是一寫多讀,指針互換準備對 ptr 進行寫操作時,要獲取鎖的等待時間并不長,并不會有長時間的鎖等待出現(xiàn),因而可以使用代價更小的自旋鎖,而不是使用代價更高的讀寫鎖。
指針訪問丟失
上面已經(jīng)介紹了指針訪問丟失的情形,即在兩個指針切換時,多個讀線程可能正在使用ptr。為了避免出現(xiàn)讀線程會讀取到無效數(shù)據(jù),本文使用的方法是利用共享指針的引用計數(shù)來實現(xiàn)指針的延遲互換。
解決ptr 的競爭條件和指針訪問丟失問題后,就可以安全的使用雙buffer 方案了。
最終的代碼如下,其中 mapptr 就是主map 指針,bakptr 是備份map 的指針:
class UpdateData {
public:
UpdateData():flag_(0) {
}
void PeriodTask();
void SetFlag(int i) {
flag_ = i;
}
private:
shared_ptr< map > map_ptr_;
SpinLock map_rwspinlock_;
shared_ptr< map > bak_map_ptr_;
int flag_;
shared_ptr< map > GetMainMapPtr();
void SetMainMapPtr(shared_ptr< map > new_map_ptr);
void SwitchMapPtr();
void PeriodTask();
void GetData(shared_ptr< map > ptr) {
ptr["abc"] = "def";
...
}
};
// 獲取主map 指針
shared_ptr< map > UpdateData::GetMainMapPtr() {
Lock(map_rwspinlock_); // 加自旋鎖,避免對 ptr 訪問出現(xiàn)競爭條件
return map_ptr_; // 主map 指針
}
// 設置主map 指針
void UpdateData::SetMainMapPtr(shared_ptr< map > new_map_ptr) {
Lock(map_rwspinlock_); // 加自旋鎖,避免對 ptr 訪問出現(xiàn)競爭條件
map_ptr_ = new_map_ptr;
}
// 真正的切換指針
void UpdateData::SwitchMapPtr() {
shared_ptr< map > old_map_ptr = GetMainMapPtr();
SetMainMapPtr(bak_ptr_); // 這里新數(shù)據(jù)已經(jīng)可以被使用了
// 用引用次數(shù)來解決訪問丟失問題
while (old_map_ptr.unique() {
::usleep(10000); // 指針延遲互換
}
bak_map_ptr_ = old_map_ptr;
bak_map_ptr_- >clear();
}
// 定時任務
void UpdateData::PeriodTask() {
while(flag) {
::sleep(300); // 每5分鐘更新一次數(shù)據(jù)
GetData(bak_ptr_); // 新數(shù)據(jù)寫到備份 map 中
SwitchMapPtr();
}
}
需要注意的是,SwitchMapPtr 中調(diào)用 SetMainMapPtr(bakptr) 之后,即使程序一直處在while 循環(huán)中,再有新的線程通過 mapptr 來訪問主map 的數(shù)據(jù)時,使用的已經(jīng)是新的數(shù)據(jù)了。while 循環(huán)是為了解決指針訪問丟失問題。當引用次數(shù)為1時,即 unique 為真時,表示已經(jīng)沒有讀線程再使用舊的 map 了,只剩下SwitchMapPtr 中old_map_ptr 這一個引用了,這時可以安全的釋放舊的map,并把它清空當作備份map繼續(xù)進行數(shù)據(jù)的更新操作。
從上面可以看出,通過使用雙buffer和共享指針,避免了在一寫多讀模式中對數(shù)據(jù)的讀寫頻繁加鎖,實現(xiàn)了”無鎖“ 的設計。
延伸
即然雙buffer可以很好的用于一寫多讀模式,那么對于”多寫一讀“或”多寫多讀“模式,是否也可以引入雙buffer 模式呢?
在含有多線程寫同一變量的情形下下,其實是不太適合使用雙buffer 方案的。主要原因是:
- 多寫的情形下,需要在 bak_map 的多個寫操作之間通過鎖來同步,雖然避免了對讀寫互斥情形的加鎖,但是多線程寫時通常對數(shù)據(jù)的實時性要求較高,如果使用雙buffer,所有新數(shù)據(jù)必須要等到指針切換時才能被使用,很可能達不到實時性要求。
- 多線程寫時若用雙buffer,則在指針切換時也需要給bak_map 加鎖,并且也要用類似于上面的while 循環(huán)來保證沒有線程在執(zhí)行寫入操作時才能進行指針切換,而且此時也要等待多讀的完成才能進行切換,這時就會出現(xiàn)對 bak_map 的鎖定時間過長,在數(shù)據(jù)更新頻繁的情況下是不合適的。
因而,在多寫的模式下,還是優(yōu)先用讀寫鎖等操作系統(tǒng)提供的同步機制。
結語
雙buffer 方案在多線程環(huán)境下能較好的解決 “一寫多讀” 時的數(shù)據(jù)更新問題,特別是適用于數(shù)據(jù)需要定期更新,且一次更新數(shù)據(jù)量較大的情形。而這種情形在后臺開發(fā)中十分常見。
-
Linux
+關注
關注
87文章
11327瀏覽量
209966 -
操作系統(tǒng)
+關注
關注
37文章
6859瀏覽量
123502 -
多線程
+關注
關注
0文章
278瀏覽量
20033 -
系統(tǒng)調(diào)用
+關注
關注
0文章
28瀏覽量
8337
發(fā)布評論請先 登錄
相關推薦
評論