Linux內核采用的是GCC編譯器,GCC編譯器除了支持ANSI C,還支持GNU C。在Linux內核中,許多地方都使用了GNU C語言的擴展特性,如typeof、__attribute__、__aligned、__builtin_等,這些都是GNU C語言的特性。
typeof
下面是比較兩個數大小返回最大值的經典宏寫法:
?
#define?max(a,b)?((a)?>?(b)???(a)?:?(b))
?
如果a傳入i++,b傳入j++,那么這個比較大小就會出錯。例如:
?
#define?max(a,b)?((a)>(b)?(a):(b)) int?x?=?1,?y?=?2; printf("max=%d ",?max(x++,?y++)); printf("x?=?%d,?y?=?%d ",?x,?y);
?
輸出結果:max=3,x=2,y=4。這是錯誤的結果,正常我們希望的是max(1,2),返回max=2。如何修改這個宏呢?
在GNU C語言中,如果知道a和b的類型,可以在宏里面定義一個變量,將a, b賦值給變量,然后再比較。例如:
?
#define?max(a,b)?({??? ????int?_a?=?(a);???? ????int?_b?=?(b);??? ????_a?>?_b???_a?:?_b;?})?
?
如果不知道具體的數據類型,可以使用typeof類轉換宏,Linux內核中的例子:
?
#define?max(a,?b)?({???????? ????typeof(a)?_a?=?(a);?????? ????typeof(b)?_b?=?(b);?????? ????(void)?(&_a?==?&_b);??? ????_a?>?_b???_a?:?_b;?})
?
typeof(a) _a = (a):定義一個a類型的變量_a,將a賦值給_a
typeof(b) _b = (b):定義一個b類型的變量_b,將b賦值給_b
(void) (&_a == &_b):判斷兩個數的類型是否相同,如果不相同,會拋出一個警告。因為a和b的類型不一樣,其指針類型也會不一樣,兩個不一樣的指針類型進行比較操作,會拋出一個編譯警告。
typeof用法舉例:
?
//typeof的參數可以是表達式或類型 //參數是類型 typeof(int?*)?a,b;//等價于:int *a,*b; //參數是表達式 int?foo(); typeof(foo())?var;//聲明了int類型的var變量,因為表達式foo()是int類型的。由于表達式不會被執行,所以不會調用foo函數。
?
零長數組
零長數組,又叫柔性數組。而它的作用主要就是為了滿足需要變長度的結構體,因此有時也習慣性地稱為變長數組。
用法:在一個結構體的最后, 申明一個長度為0的數組, 就可以使得這個結構體是可變長的。
對于編譯器來說, 此時長度為0的數組并不占用空間, 因為數組名本身不占空間, 它只是一個偏移量, 數組名這個符號本身代表了一個不可修改的地址常量
結構體中定義零長數組:
?
struct?pcpu_chunk?{ ????struct?list_head??list; ????unsigned?long????populated[];??/*?變長數組?*/ };
?
數據結構最后一個元素被定義為零長度數組,不占結構體空間。這樣,我們可以根據對象大小動態地分配結構的大小。
?
struct?line?{ ????int?length; ????char?contents[0]; }; struct?line?*thisline?=?malloc(sizeof(struct?line)?+?this_length); thisline->length?=?this_length;
?
如上例所示,struct line數據結構定義了一個int length變量和一個變長數組contents[0],這個struct line數據結構的大小只包含int類型的大小,不包含contents的大小,也就是**sizeof (struct line) = sizeof (int)**。
創建結構體對象時,可根據實際的需要指定這個可變長數組的長度,并分配相應的空間,如上述實例代碼分配了this_length 字節的內存,并且可以通過contents[index]來訪問第index個地址的數據。
case范圍
GNU C語言支持指定一個case的范圍作為一個標簽,如:
?
case?low?...high: case?'A'?...'Z':
?
這里low到high表示一個區間范圍,在ASCII字符代碼中也非常有用。下面是Linux內核中的代碼例子。
?
???? static?int?local_atoi(const?char?*name){ ????int?val?=?0; ????for?(;;?name++)?{ ????????switch?(*name)?{ ????????????case?'0'?...'9': ????????????????val?=?10*val+(*name-'0'); ????????????????break; ????????????default: ????????????????return?val; ????????} ????} }
?
另外,還可以用整形數來表示范圍,但是這里需要注意在“...”兩邊有空格,否則編譯會出錯。
?
static?int?at91sam9261_udc_init(struct?at91_udc?*udc){ ????for?(i?=?0;?i?ep[i]; ????????switch?(i)?{ ????????????case?0: ????????????????ep->maxpacket?=?8; ????????????????break; ????????????case?1?...?3: ????????????????ep->maxpacket?=?64; ????????????????break; ????????????case?4?...?5: ????????????????ep->maxpacket?=?256; ????????????????break; ????????} ????} }
?
標號元素
GNU C語言可以通過指定索引或結構體成員名來初始化,不必按照原來的固定順序進行初始化。
結構體成員的初始化在 Linux 內核中經常使用,如在設備驅動中初始化file_operations數據結構:
?
static?const?struct?file_operations?zero_fops?=?{ ????.llseek??????=?zero_lseek, ????.read????????=?new_sync_read, ????.write???????=?write_zero, ????.read_iter?????=?read_iter_zero, ????.aio_write?????=?aio_write_zero, ????.mmap????????=?mmap_zero, };
?
如上述代碼中的zero_fops的成員llseek初始化為zero_lseek函數,read成員初始化為new_sync_read函數,依次類推。當file_operations數據結構的定義發生變化時,這種初始化方法依然能保證已知元素的正確性,對于未初始化成員的值為0或者NULL。
可變參數宏
在GNU C語言中,宏可以接受可變數目的參數,主要用在輸出函數里。例如:
?
#define?pr_debug(fmt,?...)? dynamic_pr_debug(fmt,?##__VA_ARGS__)
?
“...”代表一個可以變化的參數表,“__VA_ARGS__”是編譯器保留字段,預處理時把參數傳遞給宏。當宏的調用展開時,實際參數就傳遞給dynamic_pr_debug函數了。
函數屬性
GNU C語言允許聲明函數屬性(Function Attribute)、變量屬性(Variable Attribute)和類型屬性(Type Attribute),以便編譯器進行特定方面的優化和更仔細的代碼檢查。特殊屬性語法格式為:
?
__attribute__?((attribute-list))
?
attribute-list的定義有很多,如noreturn、format以及const等。此外,還可以定義一些和處理器體系結構相關的函數屬性,如ARM體系結構中可以定義interrupt、isr等屬性。
下面是Linux內核中使用format屬性的一個例子。
?
int?libcfs_debug_msg(struct?libcfs_debug_msg_data?*msgdata,const?char?*format1,?...)__attribute__?((format?(printf,?2,?3)));
?
libcfs_debug_msg()函數里聲明了一個format函數屬性,它會告訴編譯器按照printf的參數表的格式規則對該函數參數進行檢查。數字2表示第二個參數為格式化字符串,數字3表示參數“...”里的第一個參數在函數參數總數中排在第幾個。
noreturn屬性告訴編譯器,該函數從不返回值,這可以消除一些不必要的警告信息。例如以下函數,函數不會返回:
?
void?__attribute__((noreturn))?die(void);
?
const 屬性會讓編譯器只調用該函數一次,以后再調用時只需要返回第一次結果即可,從而提高效率。
?
static?inline?u32?__attribute_const__?read_cpuid_cachetype(void){ ????return?read_cpuid(CTR_EL0); }
?
Linux還有一些其他的函數屬性,被定義在compiler-gcc.h文件中。
?
#define?__pure???????????__attribute__((pure)) #define?__aligned(x)????????__attribute__((aligned(x))) #define?__printf(a,?b)??????__attribute__((format(printf,?a,?b))) #define?__scanf(a,?b)???????__attribute__((format(scanf,?a,?b))) #define?noinline??????????__attribute__((noinline)) #define?__attribute_const__???__attribute__((__const__)) #define?__maybe_unused??????__attribute__((unused)) #define?__always_unused??????__attribute__((unused))
?
變量屬性和類型屬性
變量屬性可以對變量或結構體成員進行屬性設置。類型屬性常見的屬性有alignment、packed和sections等。
alignment屬性規定變量或者結構體成員的最小對齊格式,以字節為單位。
?
struct?qib_user_info?{ ????__u32?spu_userversion; ????__u64?spu_base_info; }?__aligned(8);
?
在這個例子中,編譯器以8字節對齊的方式來分配qib_user_info這個數據結構。
packed屬性可以使變量或者結構體成員使用最小的對齊方式,對變量是以字節對齊,對域是以位對齊。
?
struct?test{ ?char?a; ????int?x[2]?__attribute__?((packed)); };
?
x成員使用了packed屬性,它會存儲在變量a后面,所以這個結構體一共占用9字節。
內建函數
內建函數以“_builtin_”作為函數名前綴。下面介紹Linux內核常用的一些內建函數。
__builtin_constant_p(x):判斷x是否在編譯時就可以被確定為常量。如果x為常量,該函數返回1,否則返回0。
__builtin_expect(exp, c):
?
#define?__swab16(x)???????? (__builtin_constant_p((__u16)(x))???? ___constant_swab16(x)?:?????? __fswab16(x))__builtin_expect(exp,?c)
?
__builtin_expect(exp, c):這里的意思是exp==c的概率很大,用來引導GCC編譯器進行條件分支預測。開發人員知道最可能執行哪個分支,并將最有可能執行的分支告訴編譯器,讓編譯器優化指令序列,使指令盡可能地順序執行,從而提高CPU預取指令的正確率。
Linux內核中經常見到likely()和unlikely()函數,本質也是__builtin_expect():
?
#define?LIKELY(x)?__builtin_expect(!!(x),?1)?//x很可能為真 #define?UNLIKELY(x)?__builtin_expect(!!(x),?0)?//x很可能為假
?
__builtin_prefetch(const void *addr, int rw, int locality):主動進行數據預取,在使用地址addr的值之前就把其值加載到cache中,減少讀取的延遲,從而提高性能。
該函數可以接受3個參數:
第一個參數addr表示要預取數據的地址;
第二個參數rw表示讀寫屬性,1表示可寫,0表示只讀;
第三個參數locality表示數據在cache中的時間局部性,其中0表示讀取完addr的之后不用保留在cache中,而1~3表示時間局部性逐漸增強。如下面的prefetch()和prefetchw()函數的實現。
?
#define?prefetch(x)?__builtin_prefetch(x) #define?prefetchw(x)?__builtin_prefetch(x,1)
?
下面是使用prefetch()函數進行優化的一個例子。
?
void?__init?__free_pages_bootmem(struct?page?*page,?unsigned?int?order){ ????unsigned?int?nr_pages?=?1?< ?
在處理struct page數據之前,通過prefetchw()預取到cache中,從而提升性能。
asmlinkage
在標準C語言中,函數的形參在實際傳入參數時會涉及參數存放問題。
對于x86架構,函數參數和局部變量被一起分配到函數的局部堆棧里。x86中對asmlinkage的定義:
?
#define?asmlinkage?CPP_ASMLINKAGE?__attribute__((regparm(0))) ?
attribute((regparm(0))):告訴編譯器該函數不需要通過任何寄存器來傳遞參數,只通過堆棧來傳遞。
對于ARM來說,函數參數的傳遞有一套ATPCS標準,即通過寄存器來傳遞。ARM中的R0~R4寄存器存放傳入參數,當參數超過5個時,多余的參數被存放在局部堆棧中。所以,ARM平臺沒有定義asmlinkage。
?
#define?asmlinkage?CPP_ASMLINKAGE #define?asmlinkage?CPP_ASMLINKAGE ?
UL
在Linux內核代碼中,我們經常會看到一些數字的定義使用了UL后綴修飾。
數字常量會被隱形定義為int類型,兩個int類型相加的結果可能會發生溢出。
因此使用UL強制把int類型數據轉換為unsigned long類型,這是為了保證運算過程不會因為int的位數不同而導致溢出。
1 :表示有符號整型數字1
UL:表示無符號長整型數字1
end
審核編輯:劉清
評論
查看更多