語言的內存管理是語言設計的一個重要方面。它是決定語言性能的重要因素。無論是C語言的手工管理,還是Java的垃圾回收,都成為語言最重要的特征。這里以Python語言為例子,說明一門動態類型的、面向對象的語言的內存管理方式。
對象的內存使用
賦值語句是語言最常見的功能了。但即使是最簡單的賦值語句,也可以很有內涵。Python的賦值語句就很值得研究。
a = 1
? ? ? ?整數1為一個對象。而a是一個引用。利用賦值語句,引用a指向對象1。Python是動態類型的語言(參考 動態類型 ),對象與引用分離。Python像使用“筷子”那樣,通過引用來接觸和翻動真正的食物——對象。
引用和對象?
為了探索對象在內存的存儲,我們可以求助于Python的內置函數 id() 。它用于返回對象的身份(identity)。其實,這里所謂的身份,就是該對象的 內存地址 。
a = 1?
? ? ? ?print(id(a))
? ? ? ?print(hex(id(a)))
? ? ? ?在我的計算機上,它們返回的是:
11246696
? ? ? ?'0xab9c68'
? ? ? ?分別為內存地址的十進制和十六進制表示。?
在Python中,整數和短小的字符,Python都會緩存這些對象,以便重復使用。當我們創建多個等于1的引用時,實際上是讓所有這些引用指向同一個對象。
a = 1
? ? ? ?b = 1?
? ? ? ?print(id(a))
? ? ? ?print(id(b))
? ? ? ?上面程序返回
11246696?
? ? ? ?11246696
? ? ? ?可見a和b實際上是指向同一個對象的兩個引用。
為了檢驗兩個引用指向同一個對象,我們可以用 is 關鍵字。is用于判斷兩個引用所指的對象是否相同。
? ? ? ?# Truea = 1 b = 1 print(a is b) # True a = "good" b = "good" print(a is b) # False a = "very good morning" b = "very good morning" print(a is b) # False a = [] b = [] print(a is b)
? ? ? ?上面的注釋為相應的運行結果。可以看到,由于Python緩存了整數和短字符串,因此每個對象只存有一份。比如,所有整數1的引用都指向同一對象。即使使用賦值語句,也只是創造了新的引用,而不是對象本身。長的字符串和其它對象可以有多個相同的對象,可以使用賦值語句創建出新的對象。
? ? ? ?在Python中,每個對象都有存有指向該對象的引用總數,即 引用計數 (reference count)。
我們可以使用 sys 包中的 getrefcount() ,來查看某個對象的引用計數。需要注意的是,當使用某個引用作為參數,傳遞給getrefcount()時,參數實際上創建了一個臨時的引用。因此,getrefcount()所得到的結果,會比期望的多1。
? ? ? ?from sys import getrefcount a = [1, 2, 3] print(getrefcount(a)) b = a print(getrefcount(b))
由于上述原因,兩個getrefcount將返回2和3,而不是期望的1和2。
? ? ? ?對象引用對象
Python的一個容器對象(container),比如表、詞典等,可以包含多個對象。實際上,容器對象中包含的并不是元素對象本身,是指向各個元素對象的引用。
我們也可以自定義一個對象,并引用其它對象:
? ? ? ?class from_obj(object):???? def __init__(self, to_obj):???????? self.to_obj = to_obj b = [1,2,3] a = from_obj(b) print(id(a.to_obj)) print(id(b))
? ? ? ?可以看到,a引用了對象b。
? ? ? ?對象引用對象,是Python最基本的構成方式。即使是a = 1這一賦值方式,實際上是讓詞典的一個鍵值"a"的元素引用整數對象1。該詞典對象用于記錄所有的全局引用。該詞典引用了整數對象1。我們可以通過內置函數 globals() 來查看該詞典。?
當一個對象A被另一個對象B引用時,A的引用計數將增加1。
? ? ? ?from sys import getrefcount a = [1, 2, 3] print(getrefcount(a)) b = [a, a] print(getrefcount(a))
? ? ? ?
? ? ? ?由于對象b引用了兩次a,a的引用計數增加了2。
? ? ? ?容器對象的引用可能構成很復雜的拓撲結構。我們可以用objgraph包來繪制其引用關系,比如
? ? ? ?x = [1, 2, 3] y = [x, dict(key1=x)] z = [y, (x, y)] import objgraph objgraph.show_refs([z], filename='ref_topo.png')
objgraph是Python的一個第三方包。安裝之前需要安裝xdot。
sudo apt-get install xdot sudo pip install objgraph
? ? ? ?objgraph官網?
兩個對象可能相互引用,從而構成所謂的 引用環 (reference cycle)。
a = []
? ? ? ?b = [a]
? ? ? ?a.append(b)
? ? ? ?即使是一個對象,只需要自己引用自己,也能構成引用環。
a = []
? ? ? ?a.append(a)
? ? ? ?print(getrefcount(a))
? ? ? ?引用環會給垃圾回收機制帶來很大的麻煩,我將在后面詳細敘述這一點。?
評論
查看更多