概述
我們都知道一個進程是與其他進程共享CPU和內存資源的。正因如此,操作系統需要有一套完善的內存管理機制才能防止進程之間內存泄漏的問題。
為了更加有效地管理內存并減少出錯,現代操作系統提供了一種對主存的抽象概念,即是虛擬內存(Virtual Memory)。虛擬內存為每個進程提供了一個一致的、私有的地址空間,它讓每個進程產生了一種自己在獨享主存的錯覺(每個進程擁有一片連續完整的內存空間)。
理解不深刻的人會認為虛擬內存只是“使用硬盤空間來擴展內存“的技術,這是不對的。虛擬內存的重要意義是它定義了一個連續的虛擬地址空間,使得程序的編寫難度降低。并且,把內存擴展到硬盤空間只是使用虛擬內存的必然結果,虛擬內存空間會存在硬盤中,并且會被內存緩存(按需),有的操作系統還會在內存不夠的情況下,將某一進程的內存全部放入硬盤空間中,并在切換到該進程時再從硬盤讀取(這也是為什么Windows會經常假死的原因...)。
虛擬內存主要提供了如下三個重要的能力:
它把主存看作為一個存儲在硬盤上的虛擬地址空間的高速緩存,并且只在主存中緩存活動區域(按需緩存)。
它為每個進程提供了一個一致的地址空間,從而降低了程序員對內存管理的復雜性。
它還保護了每個進程的地址空間不會被其他進程破壞。
介紹了虛擬內存的基本概念之后,接下來的內容將會從虛擬內存在硬件中如何運作逐漸過渡到虛擬內存在操作系統(Linux)中的實現。
CPU尋址
內存通常被組織為一個由M個連續的字節大小的單元組成的數組,每個字節都有一個唯一的物理地址(Physical Address PA),作為到數組的索引。CPU訪問內存最簡單直接的方法就是使用物理地址,這種尋址方式被稱為物理尋址。
現代處理器使用的是一種稱為虛擬尋址(Virtual Addressing)的尋址方式。使用虛擬尋址,CPU需要將虛擬地址翻譯成物理地址,這樣才能訪問到真實的物理內存。
虛擬尋址
虛擬尋址
虛擬尋址需要硬件與操作系統之間互相合作。CPU中含有一個被稱為內存管理單元(Memory Management Unit, MMU)的硬件,它的功能是將虛擬地址轉換為物理地址。MMU需要借助存放在內存中的頁表來動態翻譯虛擬地址,該頁表由操作系統管理。
頁表
虛擬內存空間被組織為一個存放在硬盤上的M個連續的字節大小的單元組成的數組,每個字節都有一個唯一的虛擬地址,作為到數組的索引(這點其實與物理內存是一樣的)。
操作系統通過將虛擬內存分割為大小固定的塊來作為硬盤和內存之間的傳輸單位,這個塊被稱為虛擬頁(Virtual Page, VP),每個虛擬頁的大小為P=2^p字節。物理內存也會按照這種方法分割為物理頁(Physical Page, PP),大小也為P字節。
CPU在獲得虛擬地址之后,需要通過MMU將虛擬地址翻譯為物理地址。而在翻譯的過程中還需要借助頁表,所謂頁表就是一個存放在物理內存中的數據結構,它記錄了虛擬頁與物理頁的映射關系。
頁表是一個元素為頁表條目(Page Table Entry, PTE)的集合,每個虛擬頁在頁表中一個固定偏移量的位置上都有一個PTE。下面是PTE僅含有一個有效位標記的頁表結構,該有效位代表這個虛擬頁是否被緩存在物理內存中。
虛擬頁VP 0、VP 4、VP 6、VP 7被緩存在物理內存中,虛擬頁VP 2和VP 5被分配在頁表中,但并沒有緩存在物理內存,虛擬頁VP 1和VP 3還沒有被分配。
在進行動態內存分配時,例如malloc()函數或者其他高級語言中的new關鍵字,操作系統會在硬盤中創建或申請一段虛擬內存空間,并更新到頁表(分配一個PTE,使該PTE指向硬盤上這個新創建的虛擬頁)。
由于CPU每次進行地址翻譯的時候都需要經過PTE,所以如果想控制內存系統的訪問,可以在PTE上添加一些額外的許可位(例如讀寫權限、內核權限等),這樣只要有指令違反了這些許可條件,CPU就會觸發一個一般保護故障,將控制權傳遞給內核中的異常處理程序。一般這種異常被稱為“段錯誤(Segmentation Fault)”。
頁命中
頁命中
頁命中
如上圖所示,MMU根據虛擬地址在頁表中尋址到了PTE 4,該PTE的有效位為1,代表該虛擬頁已經被緩存在物理內存中了,最終MMU得到了PTE中的物理內存地址(指向PP 1)。
缺頁
缺頁
缺頁
如上圖所示,MMU根據虛擬地址在頁表中尋址到了PTE 2,該PTE的有效位為0,代表該虛擬頁并沒有被緩存在物理內存中。虛擬頁沒有被緩存在物理內存中(緩存未命中)被稱為缺頁。
當CPU遇見缺頁時會觸發一個缺頁異常,缺頁異常將控制權轉向操作系統內核,然后調用內核中的缺頁異常處理程序,該程序會選擇一個犧牲頁,如果犧牲頁已被修改過,內核會先將它復制回硬盤(采用寫回機制而不是直寫也是為了盡量減少對硬盤的訪問次數),然后再把該虛擬頁覆蓋到犧牲頁的位置,并且更新PTE。
當缺頁異常處理程序返回時,它會重新啟動導致缺頁的指令,該指令會把導致缺頁的虛擬地址重新發送給MMU。由于現在已經成功處理了缺頁異常,所以最終結果是頁命中,并得到物理地址。
這種在硬盤和內存之間傳送頁的行為稱為頁面調度(paging):頁從硬盤換入內存和從內存換出到硬盤。當缺頁異常發生時,才將頁面換入到內存的策略稱為按需頁面調度(demand paging),所有現代操作系統基本都使用的是按需頁面調度的策略。
虛擬內存跟CPU高速緩存(或其他使用緩存的技術)一樣依賴于局部性原則。雖然處理缺頁消耗的性能很多(畢竟還是要從硬盤中讀?。?,而且程序在運行過程中引用的不同虛擬頁的總數可能會超出物理內存的大小,但是局部性原則保證了在任意時刻,程序將趨向于在一個較小的活動頁面(active page)集合上工作,這個集合被稱為工作集(working set)。根據空間局部性原則(一個被訪問過的內存地址以及其周邊的內存地址都會有很大幾率被再次訪問)與時間局部性原則(一個被訪問過的內存地址在之后會有很大幾率被再次訪問),只要將工作集緩存在物理內存中,接下來的地址翻譯請求很大幾率都在其中,從而減少了額外的硬盤流量。
如果一個程序沒有良好的局部性,將會使工作集的大小不斷膨脹,直至超過物理內存的大小,這時程序會產生一種叫做抖動(thrashing)的狀態,頁面會不斷地換入換出,如此多次的讀寫硬盤開銷,性能自然會十分“恐怖”。所以,想要編寫出性能高效的程序,首先要保證程序的時間局部性與空間局部性。
多級頁表
我們目前為止討論的只是單頁表,但在實際的環境中虛擬空間地址都是很大的(一個32位系統的地址空間有2^32 = 4GB,更別說64位系統了)。在這種情況下,使用一個單頁表明顯是效率低下的。
常用方法是使用層次結構的頁表。假設我們的環境為一個32位的虛擬地址空間,它有如下形式:
虛擬地址空間被分為4KB的頁,每個PTE都是4字節。
內存的前2K個頁面分配給了代碼和數據。
之后的6K個頁面還未被分配。
再接下來的1023個頁面也未分配,其后的1個頁面分配給了用戶棧。
下圖是為該虛擬地址空間構造的二級頁表層次結構(真實情況中多為四級或更多),一級頁表(1024個PTE正好覆蓋4GB的虛擬地址空間,同時每個PTE只有4字節,這樣一級頁表與二級頁表的大小也正好與一個頁面的大小一致都為4KB)的每個PTE負責映射虛擬地址空間中一個4MB的片(chunk),每一片都由1024個連續的頁面組成。二級頁表中的每個PTE負責映射一個4KB的虛擬內存頁面。
這個結構看起來很像是一個B-Tree,這種層次結構有效的減緩了內存要求:
如果一個一級頁表的一個PTE是空的,那么相應的二級頁表也不會存在。這代表一種巨大的潛在節約(對于一個普通的程序來說,虛擬地址空間的大部分都會是未分配的)。
只有一級頁表才總是需要緩存在內存中的,這樣虛擬內存系統就可以在需要時創建、頁面調入或調出二級頁表(只有經常使用的二級頁表才會被緩存在內存中),這就減少了內存的壓力。
地址翻譯的過程
從形式上來說,地址翻譯是一個N元素的虛擬地址空間中的元素和一個M元素的物理地址空間中元素之間的映射。
下圖為MMU利用頁表進行尋址的過程:
頁表基址寄存器(PTBR)指向當前頁表。一個n位的虛擬地址包含兩個部分,一個p位的虛擬頁面偏移量(Virtual Page Offset, VPO)和一個(n - p)位的虛擬頁號(Virtual Page Number, VPN)。
MMU根據VPN來選擇對應的PTE,例如VPN 0代表PTE 0、VPN 1代表PTE 1....因為物理頁與虛擬頁的大小是一致的,所以物理頁面偏移量(Physical Page Offset, PPO)與VPO是相同的。那么之后只要將PTE中的物理頁號(Physical Page Number, PPN)與虛擬地址中的VPO串聯起來,就能得到相應的物理地址。
多級頁表的地址翻譯也是如此,只不過因為有多個層次,所以VPN需要分成多段。假設有一個k級頁表,虛擬地址會被分割成k個VPN和1個VPO,每個VPN i都是一個到第i級頁表的索引。為了構造物理地址,MMU需要訪問k個PTE才能拿到對應的PPN。
TLB
頁表是被緩存在內存中的,盡管內存的速度相對于硬盤來說已經非??炝耍cCPU還是有所差距。為了防止每次地址翻譯操作都需要去訪問內存,CPU使用了高速緩存與TLB來緩存PTE。
在最糟糕的情況下(不包括缺頁),MMU需要訪問內存取得相應的PTE,這個代價大約為幾十到幾百個周期,如果PTE湊巧緩存在L1高速緩存中(如果L1沒有還會從L2中查找,不過我們忽略多級緩沖區的細節),那么性能開銷就會下降到1個或2個周期。然而,許多系統甚至需要消除即使這樣微小的開銷,TLB由此而生。
TLB(Translation Lookaside Buffer, TLB)被稱為翻譯后備緩沖器或翻譯旁路緩沖器,它是MMU中的一個緩沖區,其中每一行都保存著一個由單個PTE組成的塊。用于組選擇和行匹配的索引與標記字段是從VPN中提取出來的,如果TLB中有T = 2^t個組,那么TLB索引(TLBI)是由VPN的t個最低位組成的,而TLB標記(TLBT)是由VPN中剩余的位組成的。
下圖為地址翻譯的流程(TLB命中的情況下):
第一步,CPU將一個虛擬地址交給MMU進行地址翻譯。
第二步和第三步,MMU通過TLB取得相應的PTE。
第四步,MMU通過PTE翻譯出物理地址并將它發送給高速緩存/內存。
第五步,高速緩存返回數據到CPU(如果緩存命中的話,否則還需要訪問內存)。
當TLB未命中時,MMU必須從高速緩存/內存中取出相應的PTE,并將新取得的PTE存放到TLB(如果TLB已滿會覆蓋一個已經存在的PTE)。
Linux中的虛擬內存系統
Linux為每個進程維護了一個單獨的虛擬地址空間。虛擬地址空間分為內核空間與用戶空間,用戶空間包括代碼、數據、堆、共享庫以及棧,內核空間包括內核中的代碼和數據結構,內核空間的某些區域被映射到所有進程共享的物理頁面。Linux也將一組連續的虛擬頁面(大小等于內存總量)映射到相應的一組連續的物理頁面,這種做法為內核提供了一種便利的方法來訪問物理內存中任何特定的位置。
Linux將虛擬內存組織成一些區域(也稱為段)的集合,區域的概念允許虛擬地址空間有間隙。一個區域就是已經存在著的已分配的虛擬內存的連續片(chunk)。例如,代碼段、數據段、堆、共享庫段,以及用戶棧都屬于不同的區域,每個存在的虛擬頁都保存在某個區域中,而不屬于任何區域的虛擬頁是不存在的,也不能被進程所引用。
內核為系統中的每個進程維護一個單獨的任務結構(task_struct)。任務結構中的元素包含或者指向內核運行該進程所需的所有信息(PID、指向用戶棧的指針、可執行目標文件的名字、程序計數器等)。
mm_struct:描述了虛擬內存的當前狀態。pgd指向一級頁表的基址(當內核運行這個進程時,pgd會被存放在CR3控制寄存器,也就是頁表基址寄存器中),mmap指向一個vm_area_structs的鏈表,其中每個vm_area_structs都描述了當前虛擬地址空間的一個區域。
vm_starts:指向這個區域的起始處。
vm_end:指向這個區域的結束處。
vm_prot:描述這個區域內包含的所有頁的讀寫許可權限。
vm_flags:描述這個區域內的頁面是與其他進程共享的,還是這個進程私有的以及一些其他信息。
vm_next:指向鏈表的下一個區域結構。
內存映射
Linux通過將一個虛擬內存區域與一個硬盤上的文件關聯起來,以初始化這個虛擬內存區域的內容,這個過程稱為內存映射(memory mapping)。這種將虛擬內存系統集成到文件系統的方法可以簡單而高效地把程序和數據加載到內存中。
一個區域可以映射到一個普通硬盤文件的連續部分,例如一個可執行目標文件。文件區(section)被分成頁大小的片,每一片包含一個虛擬頁的初始內容。由于按需頁面調度的策略,這些虛擬頁面沒有實際交換進入物理內存,直到CPU引用的虛擬地址在該區域的范圍內。如果區域比文件區要大,那么就用零來填充這個區域的余下部分。
一個區域也可以映射到一個匿名文件,匿名文件是由內核創建的,包含的全是二進制零。當CPU第一次引用這樣一個區域內的虛擬頁面時,內核就在物理內存中找到一個合適的犧牲頁面,如果該頁面被修改過,就先將它寫回到硬盤,之后用二進制零覆蓋犧牲頁并更新頁表,將這個頁面標記為已緩存在內存中的。
簡單的來說:普通文件映射就是將一個文件與一塊內存建立起映射關系,對該文件進行IO操作可以繞過內核直接在用戶態完成(用戶態在該虛擬地址區域讀寫就相當于讀寫這個文件)。匿名文件映射一般在用戶空間需要分配一段內存來存放數據時,由內核創建匿名文件并與內存進行映射,之后用戶態就可以通過操作這段虛擬地址來操作內存了。匿名文件映射最熟悉的應用場景就是動態內存分配(malloc()函數)。
Linux很多地方都采用了“懶加載”機制,自然也包括內存映射。不管是普通文件映射還是匿名映射,Linux只會先劃分虛擬內存地址。只有當CPU第一次訪問該區域內的虛擬地址時,才會真正的與物理內存建立映射關系。
只要虛擬頁被初始化了,它就在一個由內核維護的交換文件(swap file)之間換來換去。交換文件又稱為交換空間(swap space)或交換區域(swap area)。swap區域不止用于頁交換,在物理內存不夠的情況下,還會將部分內存數據交換到swap區域(使用硬盤來擴展內存)。
共享對象
虛擬內存系統為每個進程提供了私有的虛擬地址空間,這樣可以保證進程之間不會發生錯誤的讀寫。但多個進程之間也含有相同的部分,例如每個C程序都使用到了C標準庫,如果每個進程都在物理內存中保持這些代碼的副本,那會造成很大的內存資源浪費。
內存映射提供了共享對象的機制,來避免內存資源的浪費。一個對象被映射到虛擬內存的一個區域,要么是作為共享對象,要么是作為私有對象的。
如果一個進程將一個共享對象映射到它的虛擬地址空間的一個區域內,那么這個進程對這個區域的任何寫操作,對于那些也把這個共享對象映射到它們虛擬內存的其他進程而言,也是可見的。相對的,對一個映射到私有對象的區域的任何寫操作,對于其他進程來說是不可見的。一個映射到共享對象的虛擬內存區域叫做共享區域,類似地,也有私有區域。
為了節約內存,私有對象開始的生命周期與共享對象基本上是一致的(在物理內存中只保存私有對象的一份副本),并使用寫時復制的技術來應對多個進程的寫沖突。
只要沒有進程試圖寫它自己的私有區域,那么多個進程就可以繼續共享物理內存中私有對象的一個單獨副本。然而,只要有一個進程試圖對私有區域的某一頁面進行寫操作,就會觸發一個保護異常。在上圖中,進程B試圖對私有區域的一個頁面進行寫操作,該操作觸發了保護異常。異常處理程序會在物理內存中創建這個頁面的一個新副本,并更新PTE指向這個新的副本,然后恢復這個頁的可寫權限。
還有一個典型的例子就是fork()函數,該函數用于創建子進程。當fork()函數被當前進程調用時,內核會為新進程創建各種必要的數據結構,并分配給它一個唯一的PID。為了給新進程創建虛擬內存,它復制了當前進程的mm_struct、vm_area_struct和頁表的原樣副本。并將兩個進程的每個頁面都標為只讀,兩個進程中的每個區域都標記為私有區域(寫時復制)。
這樣,父進程和子進程的虛擬內存空間完全一致,只有當這兩個進程中的任一個進行寫操作時,再使用寫時復制來保證每個進程的虛擬地址空間私有的抽象概念。
動態內存分配
雖然可以使用內存映射(mmap()函數)來創建和刪除虛擬內存區域來滿足運行時動態內存分配的問題。然而,為了更好的移植性與便利性,還需要一個更高層面的抽象,也就是動態內存分配器(dynamic memory allocator)。
動態內存分配器維護著一個進程的虛擬內存區域,也就是我們所熟悉的“堆(heap)”,內核中還維護著一個指向堆頂的指針brk(break)。動態內存分配器將堆視為一個連續的虛擬內存塊(chunk)的集合,每個塊有兩種狀態,已分配和空閑。已分配的塊顯式地保留為供應用程序使用,空閑塊則可以用來進行分配,它的空閑狀態直到它顯式地被應用程序分配為止。已分配的塊要么被應用程序顯式釋放,要么被垃圾回收器所釋放。
本文只講解動態內存分配的一些概念,關于動態內存分配器的實現已經超出了本文的討論范圍。如果有對它感興趣的同學,可以去參考dlmalloc[1]的源碼,它是由Doug Lea(就是寫Java并發包的那位)實現的一個設計巧妙的內存分配器,而且源碼中的注釋十分多。
內存碎片
造成堆的空間利用率很低的主要原因是一種被稱為碎片(fragmentation)的現象,當雖然有未使用的內存但這塊內存并不能滿足分配請求時,就會產生碎片。有以下兩種形式的碎片:
內部碎片:在一個已分配塊比有效載荷大時發生。例如,程序請求一個5字(這里我們不糾結字的大小,假設一個字為4字節,堆的大小為16字并且要保證邊界雙字對齊)的塊,內存分配器為了保證空閑塊是雙字邊界對齊的(具體實現中對齊的規定可能略有不同,但對齊是肯定會有的),只好分配一個6字的塊。在本例中,已分配塊為6字,有效載荷為5字,內部碎片為已分配塊減去有效載荷,為1字。
外部碎片:當空閑內存合計起來足夠滿足一個分配請求,但是沒有一個單獨的空閑塊足夠大到可以來處理這個請求時發生。外部碎片難以量化且不可預測,所以分配器通常采用啟發式策略來試圖維持少量的大空閑塊,而不是維持大量的小空閑塊。分配器也會根據策略與分配請求的匹配來分割空閑塊與合并空閑塊(必須相鄰)。
空閑鏈表
分配器將堆組織為一個連續的已分配塊和空閑塊的序列,該序列被稱為空閑鏈表。空閑鏈表分為隱式空閑鏈表與顯式空閑鏈表。
隱式空閑鏈表,是一個單向鏈表,并且每個空閑塊僅僅是通過頭部中的大小字段隱含地連接著的。
顯式空閑鏈表,即是將空閑塊組織為某種形式的顯式數據結構(為了更加高效地合并與分割空閑塊)。例如,將堆組織為一個雙向空閑鏈表,在每個空閑塊中,都包含一個前驅節點的指針與后繼節點的指針。
查找一個空閑塊一般有如下幾種策略:
首次適配:從頭開始搜索空閑鏈表,選擇第一個遇見的合適的空閑塊。它的優點在于趨向于將大的空閑塊保留在鏈表的后面,缺點是它趨向于在靠近鏈表前部處留下碎片。
下一次適配:每次從上一次查詢結束的地方開始進行搜索,直到遇見合適的空閑塊。這種策略通常比首次適配效率高,但是內存利用率則要低得多了。
最佳適配:檢查每個空閑塊,選擇適合所需請求大小的最小空閑塊。最佳適配的內存利用率是三種策略中最高的,但它需要對堆進行徹底的搜索。
對一個鏈表進行查找操作的效率是線性的,為了減少分配請求對空閑塊匹配的時間,分配器通常采用分離存儲(segregated storage)的策略,即是維護多個空閑鏈表,其中每個鏈表的塊有大致相等的大小。
一種簡單的分離存儲策略:分配器維護一個空閑鏈表數組,然后將所有可能的塊分成一些等價類(也叫做大小類(size class)),每個大小類代表一個空閑鏈表,并且每個大小類的空閑鏈表包含大小相等的塊,每個塊的大小就是這個大小類中最大元素的大?。ɡ?,某個大小類的范圍定義為(17~32),那么這個空閑鏈表全由大小為32的塊組成)。
當有一個分配請求時,我們檢查相應的空閑鏈表。如果鏈表非空,那么就分配其中第一塊的全部。如果鏈表為空,分配器就向操作系統請求一個固定大小的額外內存片,將這個片分成大小相等的塊,然后將這些塊鏈接起來形成新的空閑鏈表。
要釋放一個塊,分配器只需要簡單地將這個塊插入到相應的空閑鏈表的頭部。
垃圾回收
在編寫C程序時,一般只能顯式地分配與釋放堆中的內存(malloc()與free()),程序員不僅需要分配內存,還需要負責內存的釋放。
許多現代編程語言都內置了自動內存管理機制(通過引入自動內存管理庫也可以讓C/C++實現自動內存管理),所謂自動內存管理,就是自動判斷不再需要的堆內存(被稱為垃圾內存),然后自動釋放這些垃圾內存。
自動內存管理的實現是垃圾收集器(garbage collector),它是一種動態內存分配器,它會自動釋放應用程序不再需要的已分配塊。
垃圾收集器一般采用以下兩種(之一)的策略來判斷一塊堆內存是否為垃圾內存:
引用計數器:在數據的物理空間中添加一個計數器,當有其他數據與其相關時(引用),該計數器加一,反之則減一。通過定期檢查計數器的值,只要為0則認為是垃圾內存,可以釋放它所占用的已分配塊。使用引用計數器,實現簡單直接,但缺點也很明顯,它無法回收循環引用的兩個對象(假設有對象A與對象B,它們2個互相引用,但實際上對象A與對象B都已經是沒用的對象了)。
可達性分析:垃圾收集器將堆內存視為一張有向圖,然后選出一組根節點(例如,在Java中一般為類加載器、全局變量、運行時常量池中的引用類型變量等),根節點必須是足夠“活躍“的對象。然后計算從根節點集合出發的可達路徑,只要從根節點出發不可達的節點,都視為垃圾內存。
垃圾收集器進行回收的算法有如下幾種:
標記-清除:該算法分為標記(mark)和清除(sweep)兩個階段。首先標記出所有需要回收的對象,然后在標記完成后統一回收所有被標記的對象。標記-清除算法實現簡單,但它的效率不高,而且會產生許多內存碎片。
標記-整理:標記-整理與標記-清除算法基本一致,只不過后續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,然后直接清理掉邊界以外的內存。
復制:將程序所擁有的內存空間劃分為大小相等的兩塊,每次都只使用其中的一塊。當這一塊的內存用完了,就把還存活著的對象復制到另一塊內存上,然后將已使用過的內存空間進行清理。這種方法不必考慮內存碎片問題,但內存利用率很低。這個比例不是絕對的,像HotSpot虛擬機為了避免浪費,將內存劃分為Eden空間與兩個Survivor空間,每次都只使用Eden和其中一個Survivor。當回收時,將Eden和Survivor中還存活著的對象一次性地復制到另外一個Survivor空間上,然后清理掉Eden和剛才使用過的Survivor空間。HotSpot虛擬機默認的Eden和Survivor的大小比例為8:1,只有10%的內存空間會被閑置浪費。
分代:分代算法根據對象的存活周期的不同將內存劃分為多塊,這樣就可以對不同的年代采用不同的回收算法。一般分為新生代與老年代,新生代存放的是存活率較低的對象,可以采用復制算法;老年代存放的是存活率較高的對象,如果使用復制算法,那么內存空間會不夠用,所以必須使用標記-清除或標記-整理算法。
總結
虛擬內存是對內存的一個抽象。支持虛擬內存的CPU需要通過虛擬尋址的方式來引用內存中的數據。CPU加載一個虛擬地址,然后發送給MMU進行地址翻譯。地址翻譯需要硬件與操作系統之間緊密合作,MMU借助頁表來獲得物理地址。
首先,MMU先將虛擬地址發送給TLB以獲得PTE(根據VPN尋址)。
如果恰好TLB中緩存了該PTE,那么就返回給MMU,否則MMU需要從高速緩存/內存中獲得PTE,然后更新緩存到TLB。
MMU獲得了PTE,就可以從PTE中獲得對應的PPN,然后結合VPO構造出物理地址。
如果在PTE中發現該虛擬頁沒有緩存在內存,那么會觸發一個缺頁異常。缺頁異常處理程序會把虛擬頁緩存進物理內存,并更新PTE。異常處理程序返回后,CPU會重新加載這個虛擬地址,并進行翻譯。
虛擬內存系統簡化了內存管理、鏈接、加載、代碼和數據的共享以及訪問權限的保護:
簡化鏈接,獨立的地址空間允許每個進程的內存映像使用相同的基本格式,而不管代碼和數據實際存放在物理內存的何處。
簡化加載,虛擬內存使向內存中加載可執行文件和共享對象文件變得更加容易。
簡化共享,獨立的地址空間為操作系統提供了一個管理用戶進程和內核之間共享的一致機制。
訪問權限保護,每個虛擬地址都要經過查詢PTE的過程,在PTE中設定訪問權限的標記位從而簡化內存的權限保護。
操作系統通過將虛擬內存與文件系統結合的方式,來初始化虛擬內存區域,這個過程稱為內存映射。應用程序顯式分配內存的區域叫做堆,通過動態內存分配器來直接操作堆內存。
審核編輯:劉清
-
處理器
+關注
關注
68文章
19384瀏覽量
230494 -
Linux
+關注
關注
87文章
11329瀏覽量
209967 -
WINDOWS
+關注
關注
4文章
3554瀏覽量
88996 -
虛擬內存
+關注
關注
0文章
77瀏覽量
8069
原文標題:終于把虛擬內存給弄明白了!
文章出處:【微信號:嵌入式情報局,微信公眾號:嵌入式情報局】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論