前篇《探秘C++內存管理(理論篇)》主要介紹了Linux C++程序內存管理的理論基礎,本文作為系列文章《探秘C++內存管理》的第二篇,將會探討經典內存管理器ptmalloc如何管理C++程序的內存。借助剖析ptmalloc解決問題的著重點和設計實現成本的權衡,更具體的呈現c++內存管理面臨的問題和工程落地中的巧思。
一、概述
GEEK TALK
ptmalloc是開源GNU C Library(glibc)默認的內存管理器,當前大部分Linux服務端程序使用的是ptmalloc提供的malloc/free系列函數,而它在性能上遠差于Meta的jemalloc和Google的tcmalloc。服務端程序調用ptmalloc提供的malloc/free函數申請和釋放內存,ptmalloc提供對內存的集中管理,以盡可能達到:
用戶申請和釋放內存更加高效,避免多線程申請內存并發和加鎖
尋求與操作系統交互過程中內存占用和malloc/free性能消耗的平衡點,降低內存碎片化,不頻繁調用系統調用函數
簡單概括ptmalloc的內存管理策略:
預先向操作系統申請并持有一塊內存供用戶malloc,同時管理已使用和空閑的內存
用戶執行free,會將回收的內存管理起來,并執行管理策略決定是否交還給操作系統
接下來,將從ptmalloc數據結構、內存分配及優缺點介紹最經典的c++內存管理器的實現和使用(以32位機為例)。
二、內存管理
GEEK TALK
2.1 數據結構
為了解決多線程鎖爭奪問題,將內存分配區分為主分配區(main_area)和非主分配區(no_main_area)。同時,為了便于管理內存,對預申請的內存采用邊界標記法劃分成很多塊(chunk);ptmalloc內存分配器中,malloc_chunk是基本組織單元,用于管理不同類型的chunk,功能和大小相近的chunk串聯成鏈表,被稱為一個bin。
main_arena與non_main_arena
主分配區和非主分配區形成一個環形鏈表進行管理, 每一個分配區利用互斥鎖實現線程對該分配區的訪問互斥。每個進程只有一個主分配區,但允許有多個非主分配區,且非主分配區的數量只增加不減少。主分配區可以訪問進程的heap區域和mmap映射區域,即主分配區可以使用sbrk()和mmap()分配內存;非主分配區只能使用mmap()分配內存。
對于不同arena的管理策略大致如下:
分配內存
查看該線程的私有變量中是否已經存在一個分配區并對其進行加鎖操作,如果加鎖成功,則使用該分配區分配內存;如果未找到該分區或加鎖失敗,遍歷環形鏈表中獲取一個未加鎖的分配區
如果整個環形鏈表中沒有未加鎖的分配區,開辟一個新的分配區,將其加入循環鏈表并加鎖,使用該分配區滿足當前線程的內存分配
釋放內存
先獲取待釋放內存塊所在的分配區的鎖,如果有其他線程正在使用該分配區,等待其他線程釋放該分配區互斥鎖后,再釋放內存
主分配區和非主分配區的結構如下:
其中fastbinsY和bins是對實際內存塊的管理和操作結構:
fastbinsY:用以保存fast bins
bins[NBINS * 2 - 2]:unsorted bin(1個,bin[1])、small bins(62 個,bin[2]~bin[63])、large bins(63 個,bin[64]~bin[126])的集合,一共有 126 個表項(NBINS = 128),bin[0] 和 bin[127] 沒有被使用
malloc_chunk與bins
ptmalloc統一管理heap和mmap映射區域中空閑的chunk,當用戶進行分配請求時,會先試圖在空閑的chunk中查找和分割,從而避免頻繁的系統調用,降低內存分配的開銷。為了更好的管理和查找空閑chunk,在預分配的空間的前后添加了必要的控制信息,內存管理結構malloc_chunk的成員及作用如下:
mchunk_prev_size: 前一個空閑chunk的大小
mchunk_size: 當前chunk的大小
必要的屬性標志位:
前一個chunk在使用中(P = 1)
當前chunk是mmap映射區域分配(M = 1)或是heap區域分配(M = 0)
當前chunk屬于非主分配區(A = 0)或非主分配區(A = 1)
fd和bk: chunk塊空閑時存在,用于將空閑chunk塊加入到空閑chunk塊鏈表中統一管理
基于chunk的大小和使用方法,劃分出以下幾種bins:
fast bins
fast bins僅保存很小的堆,采用單鏈表串聯,增刪chunk都發生在鏈表的頭部,進一步提高小內存的分配效率。fast bins記錄著大小以8字節遞增的bin鏈表,一般不會和其他堆塊合并。
unsorted bin
small bins和large bins的緩沖區,用于加快分配的速度,chunk大小無尺寸限制,用戶釋放的堆塊,會先進入unsorted bin。分配堆塊時,會優先檢查unsorted bin鏈表中是否存在合適的堆塊,并進行切割并返回。
small bins
保存大小 < 512B的chunk的bin被稱為small bins。small bins每個bin之間相差8個字節,同一個small bin中的chunk具有相同大小,采用雙向循環鏈表串聯。
large bins
保存大小 >= 512B的chunk的bin被稱為large bins。large bins中的每一個bin分別包含了一個給定范圍內的chunk,其中的chunk按大小降序,相同大小按時間降序。
當然,并不是所有chunk都按上述的方式來組織,其他常用的chunk,如:
top chunk: 分配區的頂部空閑內存,當bins不能滿足內存分配要求的時候,會嘗試在top chunk分配。
當top chunk > 用戶請求大小,top chunk會分為兩個部分:用戶請求大小(user chunk)和剩余top chunk大小(remainder chunk)
當top chunk < 用戶所請求大小,top chunk就通過sbrk(main_arena)或mmap(non_main_arena)系統調用來擴容
2.2內存分配與釋放
概括內存malloc和free的流程大致如下:
內存分配malloc流程
1、獲取分配區的鎖
2、計算出需要分配的內存的chunk實際大小
3、如果chunk的大小 < max_fast,在fast bins上查找適合的chunk;如果不存在,轉到5
4、如果chunk大小 < 512B,從small bins上去查找chunk,如果存在,分配結束
5、需要分配的是一塊大的內存,或者small bins中找不到chunk:
a.遍歷fast bins,合并相鄰的chunk,并鏈接到unsorted bin中
b.遍歷unsorted bin中的chunk:
-能夠切割chunk直接分配,分配結束
-根據chunk的空間大小將其放入small bins或是large bins中,遍歷完成后,轉到6
6、需要分配的是一塊大的內存,或者small bins和unsorted bin中都找不到合適的 chunk,且fast bins和unsorted bin中所有的chunk已清除:
從large bins中查找,反向遍歷鏈表,直到找到第一個大小大于待分配的chunk進行切割,余下放入unsorted bin,分配結束
7、檢索fast bins和bins沒有找到合適的chunk,判斷top chunk大小是否滿足所需chunk的大小,從top chunk中分配
8、top chunk不能滿足需求,需要擴大top chunk:
a.主分區上,如果分配的內存 < 分配閾值(默認128KB),使用brk()分配;如果分配的內存 > 分配閾值,使用mmap分配
b.非主分區上,使用mmap來分配一塊內存
內存釋放free流程
1、獲取分配區的鎖
2、如果free的是空指針,返回
3、如果當前chunk是mmap映射區域映射的內存,調用munmap()釋放內存
4、如果chunk與top chunk相鄰,直接與top chunk合并,轉到8
5、如果chunk的大小 > max_fast,放入unsorted bin,并且檢查是否有合并:
a.沒有合并情況則free
b.有合并情況并且和top chunk相鄰,轉到8
6、如果chunk的大小 < max_fast,放入fast bin,并且檢查是否有合并:
a.fast bin并沒有改變chunk的狀態,沒有合并情況則free
b.有合并情況,轉到7
7、在fast bin,如果相鄰chunk空閑,則將這兩個chunk合并,放入unsorted bin。如果合并后的大小 > 64KB,會觸發進行fast bins的合并操作,fast bins中的chunk將被遍歷合并,合并后的chunk會被放到unsorted bin中。合并后的chunk和top chunk相鄰,則會合并到top chunk中,轉到8
8.如果top chunk的大小 > mmap收縮閾值(默認為128KB),對于主分配區,會試圖歸還top chunk中的一部分給操作系統
三、優缺點
GEEK TALK
ptmalloc作為glibc默認的內存管理器,已經廣泛的滿足大多數大型項目的內存管理,同時它的實現思路也對后來的內存管理器提供了借鑒。
ptmalloc的介紹暫告一段落,接下來的幾篇文章將繼續探討高性能內存管理庫的集大成者——jemalloc、tcmalloc內存管理庫。
審核編輯 :李倩
-
操作系統
+關注
關注
37文章
6889瀏覽量
123647 -
C++
+關注
關注
22文章
2114瀏覽量
73815 -
內存管理
+關注
關注
0文章
168瀏覽量
14172
原文標題:百度工程師帶你探秘C++內存管理(ptmalloc篇)
文章出處:【微信號:C語言與CPP編程,微信公眾號:C語言與CPP編程】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論