最近在做通信協議相關項目,在通信過程中一般都會有包長,數據緩沖等等信息,而實際場景中,數據包長度是不確定的,使用數組的定長包或者指針數據包都有一定的缺陷,那么可變長的數據緩存方法有嗎?
有的,這就是0長度數組,又稱為柔性數組(flexible array),通常用來實現變長數組。
變長數組簡介
變長數組是數組大小待定的數組,C語言中結構體的最后一個元素可以是大小未知的數組,也就是所謂的0長度。
在標準C/C++中,不允許用0長度數組,但在GNU C中,卻可以定義0長度數組(在C99之前寫成長度為0,C99中可以直接不寫索引),我們可以用結構體來創建變長數組。
?
typedef?struct?{ ????int?len; ????int?array[0];//int?array[]; }SoftArray;
?
它的主要用途是為了滿足需要變長度的結構體,為了解決使用數組時內存的冗余和數組的越界問題。
sizeof(SoftArray);的值在32位操作系統下剛好為4,也就是一個int型變量大小,這說明結構體中的數組沒有占用內存。
對于編譯器來說,此時長度為0的數組并不占用空間,因為數組名本身不占空間,它只是一個偏移量,數組名這個符號本身代表了一個不可修改的地址常量 (注意:數組名永遠都不會是指針!)
對于這個數組的大小,我們可以進行動態分配!
對于變長數組的這個特點,很容易構造出變成結構體,如緩沖區,數據包等等
變長度數組的優缺點
這次的通信協議項目,假如使用數組來傳遞數據,那么一般定義如下,其中包的長度maxLen是一個定值,假設為1024。
?
typedef?struct?{ ????int?len; ????int?array[maxLen]; }SoftArray;
?
這包數據的大小為sizeof(int) + sizeof(int) * maxLen,由于考慮到數據的溢出, maxLen一般會設置得足夠長足以容納最大的數據, 因此數組很多情況下可能都沒有填滿數據, 造成了浪費。
而使用指針的話,則定義如下
?
typedef?struct? { ????int?len; ????char?*array; };
?
數據結構的大小為sizeof(int) + sizeof(int *),使用指針結果作為緩沖區, 只多使用了一個指針大小的空間,不會造成空間的大量浪費,但需要額外開辟和釋放數據域的空間,我們并不能假定使用者了解我們開辟的細節, 并按照約定的操作釋放空間, 因此使用起來多有不便, 甚至造成內存泄漏。
變成數組可以節約空間,解決使用數組時內存的冗余和數組的越界問題。但也有一個缺點就是結構體中的變長數組只能放在最后面。
?
typedef?struct?{ ????int?len; ????int?array[]; ????int?CRC; }SoftArray;
?
這種用法是不行的,不支持,會報以下錯誤,如果后續要加上一些其他的數據就不能用了。
其實柔性數組成員在實現跳躍表時有它特別的用法,在Redis的SDS數據結構中和跳躍表的實現上,也使用柔性數組成員。
為什么0長度數組不占用存儲空間
由于0長度數組是GNU C的擴展,有一些巧妙編寫的詭異代碼, 其執行結果就是依賴于編譯器和優化策略的實現的,我們來看看以下代碼
?
#include?#include? int?main(void) { ????char?a[0]; ????printf("%p ",?a); ????char?b[0]; ????printf("%p ",?b); ????const?char?*c=?"Hello"; ????printf("%p ",?c); ????const?char?*d?=?"Hello"; ????printf("%p ",?d); ????return?EXIT_SUCCESS; }
?
編譯結果是:
可以看到a和b的地址就會被編譯器優化到一處, 因為a[0] 和 b[0] 對于程序來說是無法使用的, 同樣編譯器對于相同字符串常量, 往往地址也是優化到一處, 減少空間占用。
所以其本質上涉及到的是一個C語言里面的數組和指針的區別問題,Programming Abstractions in C一書中提到:
“arr is defined to be identical to &arr[0]”.
也就是說,char a[1]里面的a實際是一個常量,即a = &a[0]。而char *b是有一個實實在在的指針變量b存在。所以,a=b是不允許的,而b=a是允許的。
?
#include?char?a[1]; char?*b; int?main?()?{ ?b?=?a;? ??//a=b會報錯,incompatible?types?when?assigning?to?type?‘char[1]’?from?type?‘char?*’ ?a?=?b; ?return?0; }
?
兩種變量都支持下標式的訪問,那么對于a[0]和b[0]本質上是否有區別?我們可以通過一個例子來說明。
變長數組和動態數組有什么區別?
動態數組是指在聲明時,沒有確定數組大小的數組,它可以隨程序需要而重新指定大小。動態數組的內存空間是從堆動態分配的,當程序執行到我們編寫的分配語句時,才為其分配存儲空間。
使用動態數組的優點是可以根據用戶需要,有效利用存儲空間。
?
int?a[10];//靜態數組,在堆棧上創建 int?n; //C語言的malloc函數進行書寫 int?*p?=?(int?*)malloc(n?*?sizeof(int));
?
變長數組的實際意思是以變量作為長度的數組,區別于以常數作為長度的數組。英文Variable-Length Array(后續都縮寫成VLA),注意這里有一個連接號。
連接號-代表的意思是,Variable不是一個用于修飾Length的形容詞,而是一個名字名詞(即變量的意思)。
了解了正確的含義后,不難理解VLA的目的就是數組的長度是由一個變量指定的,而非常數。
小結
實際工程中不推薦使用VLA,程序中棧的大小是有限的,若需要的數組長度很大,有造成爆棧的危險。
審核編輯:劉清
評論
查看更多