Netlink 是一種特殊的 socket,它是 Linux 所特有的,類(lèi)似于 BSD 中的AF_ROUTE 但又遠(yuǎn)比它的功能強(qiáng)大,目前在最新的 Linux 內(nèi)核(2.6.14)中使用netlink 進(jìn)行應(yīng)用與內(nèi)核通信的應(yīng)用很多,包括:
路由 daemon(NETLINK_ROUTE),
1-wire 子系統(tǒng)(NETLINK_W1),
用戶態(tài) socket 協(xié)議(NETLINK_USERSOCK),
防火墻(NETLINK_FIREWALL),
socket 監(jiān)視(NETLINK_INET_DIAG),
netfilter 日志(NETLINK_NFLOG),
ipsec 安全策略(NETLINK_XFRM),
SELinux 事件通知(NETLINK_SELINUX),
iSCSI 子系統(tǒng)(NETLINK_ISCSI),
進(jìn)程審計(jì)(NETLINK_AUDIT),
轉(zhuǎn)發(fā)信息表查詢(NETLINK_FIB_LOOKUP),
netlink connector(NETLINK_CONNECTOR),
netfilter 子系統(tǒng)(NETLINK_NETFILTER),
IPv6 防火墻(NETLINK_IP6_FW),
DECnet 路由信息(NETLINK_DNRTMSG),
內(nèi)核事件向用戶態(tài)通知(NETLINK_KOBJECT_UEVENT),
通用 netlink(NETLINK_GENERIC)。
Netlink 是一種在內(nèi)核與用戶應(yīng)用間進(jìn)行雙向數(shù)據(jù)傳輸?shù)姆浅:玫姆绞剑脩魬B(tài)應(yīng)用使用標(biāo)準(zhǔn)的 socket API 就可以使用 netlink 提供的強(qiáng)大功能,內(nèi)核態(tài)需要使用專(zhuān)門(mén)的內(nèi)核 API 來(lái)使用 netlink。
Netlink 相對(duì)于系統(tǒng)調(diào)用,ioctl 以及 /proc 文件系統(tǒng)而言具有以下優(yōu)點(diǎn):
1,為了使用 netlink,用戶僅需要在 include/linux/netlink.h 中增加一個(gè)新類(lèi)型的 netlink 協(xié)議定義即可,如 #define NETLINK_MYTEST 17 然后,內(nèi)核和用戶態(tài)應(yīng)用就可以立即通過(guò) socket API 使用該 netlink 協(xié)議類(lèi)型進(jìn)行數(shù)據(jù)交換。但系統(tǒng)調(diào)用需要增加新的系統(tǒng)調(diào)用,ioctl 則需要增加設(shè)備或文件, 那需要不少代碼,proc 文件系統(tǒng)則需要在 /proc 下添加新的文件或目錄,那將使本來(lái)就混亂的 /proc 更加混亂。
2. netlink是一種異步通信機(jī)制,在內(nèi)核與用戶態(tài)應(yīng)用之間傳遞的消息保存在socket緩存隊(duì)列中,發(fā)送消息只是把消息保存在接收者的socket的接 收隊(duì)列,而不需要等待接收者收到消息,但系統(tǒng)調(diào)用與 ioctl 則是同步通信機(jī)制,如果傳遞的數(shù)據(jù)太長(zhǎng),將影響調(diào)度粒度。
3.使用 netlink 的內(nèi)核部分可以采用模塊的方式實(shí)現(xiàn),使用 netlink 的應(yīng)用部分和內(nèi)核部分沒(méi)有編譯時(shí)依賴,但系統(tǒng)調(diào)用就有依賴,而且新的系統(tǒng)調(diào)用的實(shí)現(xiàn)必須靜態(tài)地連接到內(nèi)核中,它無(wú)法在模塊中實(shí)現(xiàn),使用新系統(tǒng)調(diào)用的應(yīng)用在編譯時(shí)需要依賴內(nèi)核。
4.netlink 支持多播,內(nèi)核模塊或應(yīng)用可以把消息多播給一個(gè)netlink組,屬于該neilink 組的任何內(nèi)核模塊或應(yīng)用都能接收到該消息,內(nèi)核事件向用戶態(tài)的通知機(jī)制就使用了這一特性,任何對(duì)內(nèi)核事件感興趣的應(yīng)用都能收到該子系統(tǒng)發(fā)送的內(nèi)核事件,在后面的文章中將介紹這一機(jī)制的使用。
5.內(nèi)核可以使用 netlink 首先發(fā)起會(huì)話,但系統(tǒng)調(diào)用和 ioctl 只能由用戶應(yīng)用發(fā)起調(diào)用。
6.netlink 使用標(biāo)準(zhǔn)的 socket API,因此很容易使用,但系統(tǒng)調(diào)用和 ioctl則需要專(zhuān)門(mén)的培訓(xùn)才能使用。
用戶態(tài)使用 netlink
用戶態(tài)應(yīng)用使用標(biāo)準(zhǔn)的socket APIs, socket(), bind(), sendmsg(), recvmsg() 和 close() 就能很容易地使用 netlink socket,查詢手冊(cè)頁(yè)可以了解這些函數(shù)的使用細(xì)節(jié),本文只是講解使用 netlink 的用戶應(yīng)該如何使用這些函數(shù)。注意,使用 netlink 的應(yīng)用必須包含頭文件 linux/netlink.h。當(dāng)然 socket 需要的頭文件也必不可少,sys/socket.h。
為了創(chuàng)建一個(gè) netlink socket,用戶需要使用如下參數(shù)調(diào)用 socket():
socket(AF_NETLINK, SOCK_RAW, netlink_type)
第一個(gè)參數(shù)必須是 AF_NETLINK 或 PF_NETLINK,在 Linux 中,它們倆實(shí)際為一個(gè)東西,它表示要使用netlink,第二個(gè)參數(shù)必須是SOCK_RAW或SOCK_DGRAM, 第三個(gè)參數(shù)指定netlink協(xié)議類(lèi)型,如前面講的用戶自定義協(xié)議類(lèi)型NETLINK_MYTEST, NETLINK_GENERIC是一個(gè)通用的協(xié)議類(lèi)型,它是專(zhuān)門(mén)為用戶使用的,因此,用戶可以直接使用它,而不必再添加新的協(xié)議類(lèi)型。內(nèi)核預(yù)定義的協(xié)議類(lèi)型有:
#define NETLINK_ROUTE 0 /* Routing/device hook */
#define NETLINK_W1 1 /* 1-wire subsystem */
#define NETLINK_USERSOCK 2 /* Reserved for user mode socket protocols */
#define NETLINK_FIREWALL 3 /* Firewalling hook */
#define NETLINK_INET_DIAG 4 /* INET socket monitoring */
#define NETLINK_NFLOG 5 /* netfilter/iptables ULOG */
#define NETLINK_XFRM 6 /* ipsec */
#define NETLINK_SELINUX 7 /* SELinux event notifications */
#define NETLINK_ISCSI 8 /* Open-iSCSI */
#define NETLINK_AUDIT 9 /* auditing */
#define NETLINK_FIB_LOOKUP 10
#define NETLINK_CONNECTOR 11
#define NETLINK_NETFILTER 12 /* netfilter subsystem */
#define NETLINK_IP6_FW 13
#define NETLINK_DNRTMSG 14 /* DECnet routing messages */
#define NETLINK_KOBJECT_UEVENT 15 /* Kernel messages to userspace */
#define NETLINK_GENERIC 16
對(duì)于每一個(gè)netlink協(xié)議類(lèi)型,可以有多達(dá) 32多播組,每一個(gè)多播組用一個(gè)位表示,netlink 的多播特性使得發(fā)送消息給同一個(gè)組僅需要一次系統(tǒng)調(diào)用,因而對(duì)于需要多撥消息的應(yīng)用而言,大大地降低了系統(tǒng)調(diào)用的次數(shù)。
函數(shù) bind() 用于把一個(gè)打開(kāi)的 netlink socket 與 netlink 源 socket 地址綁定在一起。netlink socket 的地址結(jié)構(gòu)如下:
struct sockaddr_nl
{
sa_family_t nl_family;
unsigned short nl_pad;
__u32 nl_pid;
__u32 nl_groups;
};
字段 nl_family 必須設(shè)置為 AF_NETLINK 或著 PF_NETLINK,字段 nl_pad 當(dāng)前沒(méi)有使用,因此要總是設(shè)置為 0,字段 nl_pid 為接收或發(fā)送消息的進(jìn)程的 ID,如果希望內(nèi)核處理消息或多播消息,就把該字段設(shè)置為 0,否則設(shè)置為處理消息的進(jìn)程 ID。字段 nl_groups 用于指定多播組,bind 函數(shù)用于把調(diào)用進(jìn)程加入到該字段指定的多播組,如果設(shè)置為 0,表示調(diào)用者不加入任何多播組。
傳遞給 bind 函數(shù)的地址的 nl_pid 字段應(yīng)當(dāng)設(shè)置為本進(jìn)程的進(jìn)程 ID,這相當(dāng)于 netlink socket 的本地地址。但是,對(duì)于一個(gè)進(jìn)程的多個(gè)線程使用 netlink socket 的情況,字段 nl_pid 則可以設(shè)置為其它的值,如:
pthread_self() 《《 16 | getpid();
因此字段 nl_pid 實(shí)際上未必是進(jìn)程 ID,它只是用于區(qū)分不同的接收者或發(fā)送者的一個(gè)標(biāo)識(shí),用戶可以根據(jù)自己需要設(shè)置該字段。函數(shù) bind 的調(diào)用方式如下:
bind(fd, (struct sockaddr*)&nladdr, sizeof(struct sockaddr_nl));
fd為前面的 socket 調(diào)用返回的文件描述符,參數(shù) nladdr 為 struct sockaddr_nl 類(lèi)型的地址。 為了發(fā)送一個(gè) netlink 消息給內(nèi)核或其他用戶態(tài)應(yīng)用,需要填充目標(biāo) netlink socket 地址 ,此時(shí),字段 nl_pid 和 nl_groups 分別表示接收消息者的進(jìn)程 ID 與多播組。如果字段 nl_pid 設(shè)置為 0,表示消息接收者為內(nèi)核或多播組,如果 nl_groups為 0,表示該消息為單播消息,否則表示多播消息。 使用函數(shù) sendmsg 發(fā)送 netlink 消息時(shí)還需要引用結(jié)構(gòu) struct msghdr、struct nlmsghdr 和 struct iovec,結(jié)構(gòu) struct msghdr 需如下設(shè)置:
struct msghdr msg;
memset(&msg, 0, sizeof(msg));
msg.msg_name = (void *)&(nladdr);
msg.msg_namelen = sizeof(nladdr);
其中 nladdr 為消息接收者的 netlink 地址。
struct nlmsghdr 為 netlink socket 自己的消息頭,這用于多路復(fù)用和多路分解 netlink 定義的所有協(xié)議類(lèi)型以及其它一些控制,netlink 的內(nèi)核實(shí)現(xiàn)將利用這個(gè)消息頭來(lái)多路復(fù)用和多路分解已經(jīng)其它的一些控制,因此它也被稱(chēng)為netlink 控制塊。因此,應(yīng)用在發(fā)送 netlink 消息時(shí)必須提供該消息頭。
struct nlmsghdr
{
__u32 nlmsg_len; /* Length of message */
__u16 nlmsg_type; /* Message type*/
__u16 nlmsg_flags; /* Additional flags */
__u32 nlmsg_seq; /* Sequence number */
__u32 nlmsg_pid; /* Sending process PID */
};
字段 nlmsg_len 指定消息的總長(zhǎng)度,包括緊跟該結(jié)構(gòu)的數(shù)據(jù)部分長(zhǎng)度以及該結(jié)構(gòu)的大小,字段 nlmsg_type 用于應(yīng)用內(nèi)部定義消息的類(lèi)型,它對(duì) netlink 內(nèi)核實(shí)現(xiàn)是透明的,因此大部分情況下設(shè)置為 0,字段 nlmsg_flags 用于設(shè)置消息標(biāo)志,可用的標(biāo)志包括:
/* Flags values */
#define NLM_F_REQUEST 1 /* It is request message. */
#define NLM_F_MULTI 2 /* Multipart message, terminated by NLMSG_DONE */
#define NLM_F_ACK 4 /* Reply with ack, with zero or error code */
#define NLM_F_ECHO 8 /* Echo this request */
/* Modifiers to GET request */
#define NLM_F_ROOT 0x100 /* specify tree root */
#define NLM_F_MATCH 0x200 /* return all matching */
#define NLM_F_ATOMIC 0x400 /* atomic GET */
#define NLM_F_DUMP (NLM_F_ROOT|NLM_F_MATCH)
/* Modifiers to NEW request */
#define NLM_F_REPLACE 0x100 /* Override existing */
#define NLM_F_EXCL 0x200 /* Do not touch, if it exists */
#define NLM_F_CREATE 0x400 /* Create, if it does not exist */
#define NLM_F_APPEND 0x800 /* Add to end of list */
標(biāo)志NLM_F_REQUEST用于表示消息是一個(gè)請(qǐng)求,所有應(yīng)用首先發(fā)起的消息都應(yīng)設(shè)置該標(biāo)志。
標(biāo)志NLM_F_MULTI 用于指示該消息是一個(gè)多部分消息的一部分,后續(xù)的消息可以通過(guò)宏NLMSG_NEXT來(lái)獲得。
宏NLM_F_ACK表示該消息是前一個(gè)請(qǐng)求消息的響應(yīng),順序號(hào)與進(jìn)程ID可以把請(qǐng)求與響應(yīng)關(guān)聯(lián)起來(lái)。
標(biāo)志NLM_F_ECHO表示該消息是相關(guān)的一個(gè)包的回傳。
標(biāo)志NLM_F_ROOT 被許多 netlink 協(xié)議的各種數(shù)據(jù)獲取操作使用,該標(biāo)志指示被請(qǐng)求的數(shù)據(jù)表應(yīng)當(dāng)整體返回用戶應(yīng)用,而不是一個(gè)條目一個(gè)條目地返回。有該標(biāo)志的請(qǐng)求通常導(dǎo)致響應(yīng)消息設(shè)置 NLM_F_MULTI標(biāo)志。注意,當(dāng)設(shè)置了該標(biāo)志時(shí),請(qǐng)求是協(xié)議特定的,因此,需要在字段 nlmsg_type 中指定協(xié)議類(lèi)型。
標(biāo)志 NLM_F_MATCH 表示該協(xié)議特定的請(qǐng)求只需要一個(gè)數(shù)據(jù)子集,數(shù)據(jù)子集由指定的協(xié)議特定的過(guò)濾器來(lái)匹配。
標(biāo)志 NLM_F_ATOMIC 指示請(qǐng)求返回的數(shù)據(jù)應(yīng)當(dāng)原子地收集,這預(yù)防數(shù)據(jù)在獲取期間被修改。
標(biāo)志 NLM_F_DUMP 未實(shí)現(xiàn)。
標(biāo)志 NLM_F_REPLACE 用于取代在數(shù)據(jù)表中的現(xiàn)有條目。
標(biāo)志 NLM_F_EXCL_ 用于和 CREATE 和 APPEND 配合使用,如果條目已經(jīng)存在,將失敗。
標(biāo)志 NLM_F_CREATE 指示應(yīng)當(dāng)在指定的表中創(chuàng)建一個(gè)條目。
標(biāo)志 NLM_F_APPEND 指示在表末尾添加新的條目。
內(nèi)核需要讀取和修改這些標(biāo)志,對(duì)于一般的使用,用戶把它設(shè)置為 0 就可以,只是一些高級(jí)應(yīng)用(如 netfilter 和路由 daemon 需要它進(jìn)行一些復(fù)雜的操作),字段 nlmsg_seq 和 nlmsg_pid 用于應(yīng)用追蹤消息,前者表示順序號(hào),后者為消息來(lái)源進(jìn)程 ID。下面是一個(gè)示例:
#define MAX_MSGSIZE 1024
char buffer[] = “An example message”;
struct nlmsghdr nlhdr;
nlhdr = (struct nlmsghdr *)malloc(NLMSG_SPACE(MAX_MSGSIZE));
strcpy(NLMSG_DATA(nlhdr),buffer);
nlhdr-》nlmsg_len = NLMSG_LENGTH(strlen(buffer));
nlhdr-》nlmsg_pid = getpid(); /* self pid */
nlhdr-》nlmsg_flags = 0;
結(jié)構(gòu) struct iovec 用于把多個(gè)消息通過(guò)一次系統(tǒng)調(diào)用來(lái)發(fā)送,下面是該結(jié)構(gòu)使用示例:
struct iovec iov;
iov.iov_base = (void *)nlhdr;
iov.iov_len = nlh-》nlmsg_len;
msg.msg_iov = &iov;
msg.msg_iovlen = 1;
在完成以上步驟后,消息就可以通過(guò)下面語(yǔ)句直接發(fā)送:
sendmsg(fd, &msg, 0);
應(yīng)用接收消息時(shí)需要首先分配一個(gè)足夠大的緩存來(lái)保存消息頭以及消息的數(shù)據(jù)部分,然后填充消息頭,添完后就可以直接調(diào)用函數(shù) recvmsg() 來(lái)接收。
#define MAX_NL_MSG_LEN 1024
struct sockaddr_nl nladdr;
struct msghdr msg;
struct iovec iov;
struct nlmsghdr * nlhdr;
nlhdr = (struct nlmsghdr *)malloc(MAX_NL_MSG_LEN);
iov.iov_base = (void *)nlhdr;
iov.iov_len = MAX_NL_MSG_LEN;
msg.msg_name = (void *)&(nladdr);
msg.msg_namelen = sizeof(nladdr);
msg.msg_iov = &iov;
msg.msg_iovlen = 1;
recvmsg(fd, &msg, 0);
注意:fd為socket調(diào)用打開(kāi)的netlink socket描述符。
在消息接收后,nlhdr指向接收到的消息的消息頭,nladdr保存了接收到的消息的目標(biāo)地址,宏NLMSG_DATA(nlhdr)返回指向消息的數(shù)據(jù)部分的指針。
在linux/netlink.h中定義了一些方便對(duì)消息進(jìn)行處理的宏,這些宏包括:
#define NLMSG_ALIGNTO 4
/*宏NLMSG_ALIGN(len)用于得到不小于len且字節(jié)對(duì)齊的最小數(shù)值*/
#define NLMSG_ALIGN(len) ( ((len)+NLMSG_ALIGNTO-1) & ~(NLMSG_ALIGNTO-1) )
/*宏NLMSG_LENGTH(len)用于計(jì)算數(shù)據(jù)部分長(zhǎng)度為len時(shí)實(shí)際的消息長(zhǎng)度。它一般用于分配消息緩存*/
#define NLMSG_LENGTH(len) ((len)+NLMSG_ALIGN(sizeof(struct nlmsghdr)))
/*宏NLMSG_SPACE(len)返回不小于NLMSG_LENGTH(len)且字節(jié)對(duì)齊的最小數(shù)值,它也用于分配消息緩存*/
#define NLMSG_SPACE(len) NLMSG_ALIGN(NLMSG_LENGTH(len))
/*宏NLMSG_DATA(nlh)用于取得消息的數(shù)據(jù)部分的首地址,設(shè)置和讀取消息數(shù)據(jù)部分時(shí)需要使用該宏*/
#define NLMSG_DATA(nlh) ((void*)(((char*)nlh) + NLMSG_LENGTH(0)))
/*宏NLMSG_NEXT(nlh,len)用于得到下一個(gè)消息的首地址,同時(shí)len也減少為剩余消息的總長(zhǎng)度,該宏一般
在一個(gè)消息被分成幾個(gè)部分發(fā)送或接收時(shí)使用*/
#define NLMSG_NEXT(nlh,len) ((len) -= NLMSG_ALIGN((nlh)-》nlmsg_len), \
(struct nlmsghdr*)(((char*)(nlh)) + NLMSG_ALIGN((nlh)-》nlmsg_len)))
/*宏NLMSG_OK(nlh,len)用于判斷消息是否有l(wèi)en這么長(zhǎng)*/
#define NLMSG_OK(nlh,len) ((len) 》= (int)sizeof(struct nlmsghdr) && \
(nlh)-》nlmsg_len 》= sizeof(struct nlmsghdr) && \
(nlh)-》nlmsg_len 《= (len))
/*宏NLMSG_PAYLOAD(nlh,len)用于返回payload的長(zhǎng)度*/
#define NLMSG_PAYLOAD(nlh,len) ((nlh)-》nlmsg_len - NLMSG_SPACE((len)))
函數(shù)close用于關(guān)閉打開(kāi)的netlink socket。
netlink內(nèi)核API
netlink的內(nèi)核實(shí)現(xiàn)在.c文件net/core/af_netlink.c中,內(nèi)核模塊要想使用netlink,也必須包含頭文件 linux/netlink.h。內(nèi)核使用netlink需要專(zhuān)門(mén)的API,這完全不同于用戶態(tài)應(yīng)用對(duì)netlink的使用。如果用戶需要增加新的 netlink協(xié)議類(lèi)型,必須通過(guò)修改linux/netlink.h來(lái)實(shí)現(xiàn),當(dāng)然,目前的netlink實(shí)現(xiàn)已經(jīng)包含了一個(gè)通用的協(xié)議類(lèi)型 NETLINK_GENERIC以方便用戶使用,用戶可以直接使用它而不必增加新的協(xié)議類(lèi)型。前面講到,為了增加新的netlink協(xié)議類(lèi)型,用戶僅需增 加如下定義到linux/netlink.h就可以:
#define NETLINK_MYTEST 17
只要增加這個(gè)定義之后,用戶就可以在內(nèi)核的任何地方引用該協(xié)議。
在內(nèi)核中,為了創(chuàng)建一個(gè)netlink socket用戶需要調(diào)用如下函數(shù):
struct sock *
netlink_kernel_create(int unit, void (*input)(struct sock *sk, int len));
參數(shù)unit表示netlink協(xié)議類(lèi)型,如NETLINK_MYTEST,參數(shù)input則為內(nèi)核模塊定義的netlink消息處理函數(shù),當(dāng)有消 息到達(dá)這個(gè)netlink socket時(shí),該input函數(shù)指針就會(huì)被引用。函數(shù)指針input的參數(shù)sk實(shí)際上就是函數(shù)netlink_kernel_create返回的 struct sock指針,sock實(shí)際是socket的一個(gè)內(nèi)核表示數(shù)據(jù)結(jié)構(gòu),用戶態(tài)應(yīng)用創(chuàng)建的socket在內(nèi)核中也會(huì)有一個(gè)struct sock結(jié)構(gòu)來(lái)表示。下面是一個(gè)input函數(shù)的示例:
void input (struct sock *sk, int len)
{
struct sk_buff *skb;
struct nlmsghdr *nlh = NULL;
u8 *data = NULL;
while ((skb = skb_dequeue(&sk-》receive_queue)) != NULL)
{
/* process netlink message pointed by skb-》data */
nlh = (struct nlmsghdr *)skb-》data;
data = NLMSG_DATA(nlh);
/* process netlink message with header pointed by
* nlh and data pointed by data
*/
}
}
函數(shù)input()會(huì)在發(fā)送進(jìn)程執(zhí)行sendmsg()時(shí)被調(diào)用,這樣處理消息比較及時(shí),但是,如果消息特別長(zhǎng)時(shí),這樣處理將增加系統(tǒng)調(diào)用 sendmsg()的執(zhí)行時(shí)間,對(duì)于這種情況,可以定義一個(gè)內(nèi)核線程專(zhuān)門(mén)負(fù)責(zé)消息接收,而函數(shù)input的工作只是喚醒該內(nèi)核線程,這樣sendmsg將 很快返回。
函數(shù)skb = skb_dequeue(&sk-》receive_queue)用于取得socket sk的接收隊(duì)列上的消息,返回為一個(gè)struct sk_buff的結(jié)構(gòu),skb-》data指向?qū)嶋H的netlink消息。
函數(shù)skb_recv_datagram(nl_sk)也用于在netlink socket nl_sk上接收消息,與skb_dequeue的不同指出是,如果socket的接收隊(duì)列上沒(méi)有消息,它將導(dǎo)致調(diào)用進(jìn)程睡眠在等待隊(duì)列nl_sk- 》sk_sleep,因此它必須在進(jìn)程上下文使用,剛才講的內(nèi)核線程就可以采用這種方式來(lái)接收消息。
下面的函數(shù)input就是這種使用的示例:
void input (struct sock *sk, int len)
{
wake_up_interruptible(sk-》sk_sleep);
}
當(dāng)內(nèi)核中發(fā)送netlink消息時(shí),也需要設(shè)置目標(biāo)地址與源地址,而且內(nèi)核中消息是通過(guò)struct sk_buff來(lái)管理的, linux/netlink.h中定義了一個(gè)宏:
#define NETLINK_CB(skb) (*(struct netlink_skb_parms*)&((skb)-》cb))
來(lái)方便消息的地址設(shè)置。下面是一個(gè)消息地址設(shè)置的例子:
NETLINK_CB(skb).pid = 0;
NETLINK_CB(skb).dst_pid = 0;
NETLINK_CB(skb).dst_group = 1;
字段pid表示消息發(fā)送者進(jìn)程ID,也即源地址,對(duì)于內(nèi)核,它為 0, dst_pid 表示消息接收者進(jìn)程 ID,也即目標(biāo)地址,如果目標(biāo)為組或內(nèi)核,它設(shè)置為 0,否則 dst_group 表示目標(biāo)組地址,如果它目標(biāo)為某一進(jìn)程或內(nèi)核,dst_group 應(yīng)當(dāng)設(shè)置為 0。
在內(nèi)核中,模塊調(diào)用函數(shù) netlink_unicast 來(lái)發(fā)送單播消息:
int netlink_unicast(struct sock *sk, struct sk_buff *skb, u32 pid, int nonblock);
參數(shù)sk為函數(shù)netlink_kernel_create()返回的socket,參數(shù)skb存放消息,它的data字段指向要發(fā)送的 netlink消息結(jié)構(gòu),而skb的控制塊保存了消息的地址信息,前面的宏NETLINK_CB(skb)就用于方便設(shè)置該控制塊, 參數(shù)pid為接收消息進(jìn)程的pid,參數(shù)nonblock表示該函數(shù)是否為非阻塞,如果為1,該函數(shù)將在沒(méi)有接收緩存可利用時(shí)立即返回,而如果為0,該函 數(shù)在沒(méi)有接收緩存可利用時(shí)睡眠。
內(nèi)核模塊或子系統(tǒng)也可以使用函數(shù)netlink_broadcast來(lái)發(fā)送廣播消息:
void netlink_broadcast(struct sock *sk, struct sk_buff *skb, u32 pid, u32 group, int allocation);
前面的三個(gè)參數(shù)與netlink_unicast相同,參數(shù)group為接收消息的多播組,該參數(shù)的每一個(gè)代表一個(gè)多播組,因此如果發(fā)送給多個(gè)多播組,就把該參數(shù)設(shè)置為多個(gè)多播組組ID的位或。參數(shù)allocation為內(nèi)核內(nèi)存分配類(lèi)型,一般地為GFP_ATOMIC或GFP_KERNEL, GFP_ATOMIC用于原子的上下文(即不可以睡眠),而GFP_KERNEL用于非原子上下文。
在內(nèi)核中使用函數(shù)sock_release來(lái)釋放函數(shù)netlink_kernel_create()創(chuàng)建的netlink socket:
void sock_release(struct socket * sock);
注意函數(shù)netlink_kernel_create()返回的類(lèi)型為struct sock,因此函數(shù)sock_release應(yīng)該這種調(diào)用:
sock_release(sk-》sk_socket);
sk為函數(shù)netlink_kernel_create()的返回值。
在源代碼包中 給出了一個(gè)使用 netlink 的示例,它包括一個(gè)內(nèi)核模塊 netlink-exam-kern.c 和兩個(gè)應(yīng)用程序 netlink-exam-user-recv.c, netlink-exam-user-send.c。內(nèi)核模塊必須先插入到內(nèi)核,然后在一個(gè)終端上運(yùn)行用戶態(tài)接收程序,在另一個(gè)終端上運(yùn)行用戶態(tài)發(fā)送程序,發(fā)送程序讀取參數(shù)指定的文本文件并把它作為 netlink 消息的內(nèi)容發(fā)送給內(nèi)核模塊,內(nèi)核模塊接受該消息保存到內(nèi)核緩存中,它也通過(guò)proc接口出口到 procfs,因此用戶也能夠通過(guò) /proc/netlink_exam_buffer 看到全部的內(nèi)容,同時(shí)內(nèi)核也把該消息發(fā)送給用戶態(tài)接收程序,用戶態(tài)接收程序?qū)呀邮盏降膬?nèi)容輸出到屏幕上。
示例:
內(nèi)核模塊 netlink-exam-kern.c:
//kernel module: netlink-exam-kern.c
#include 《linux/config.h》
#include 《linux/module.h》
#include 《linux/netlink.h》
#include 《linux/sched.h》
#include 《net/sock.h》
#include 《linux/proc_fs.h》
#define BUF_SIZE 16384
static struct sock *netlink_exam_sock;
static unsigned char buffer[BUF_SIZE];
static unsigned int buffer_tail = 0;
static int exit_flag = 0;
static DECLARE_COMPLETION(exit_completion);
static void recv_handler(struct sock * sk, int length)
{
wake_up(sk-》sk_sleep);
}
static int process_message_thread(void * data)
{
struct sk_buff * skb = NULL;
struct nlmsghdr * nlhdr = NULL;
int len;
DEFINE_WAIT(wait);
daemonize(“mynetlink”);
while (exit_flag == 0) {
prepare_to_wait(netlink_exam_sock-》sk_sleep, &wait, TASK_INTERRUPTIBLE);
schedule();
finish_wait(netlink_exam_sock-》sk_sleep, &wait);
while ((skb = skb_dequeue(&netlink_exam_sock-》sk_receive_queue))
!= NULL) {
nlhdr = (struct nlmsghdr *)skb-》data;
if (nlhdr-》nlmsg_len 《 sizeof(struct nlmsghdr)) {
printk(“Corrupt netlink message.\n”);
continue;
}
len = nlhdr-》nlmsg_len - NLMSG_LENGTH(0);
if (len + buffer_tail 》 BUF_SIZE) {
printk(“netlink buffer is full.\n”);
}
else {
memcpy(buffer + buffer_tail, NLMSG_DATA(nlhdr), len);
buffer_tail += len;
}
nlhdr-》nlmsg_pid = 0;
nlhdr-》nlmsg_flags = 0;
NETLINK_CB(skb).pid = 0;
NETLINK_CB(skb).dst_pid = 0;
NETLINK_CB(skb).dst_group = 1;
netlink_broadcast(netlink_exam_sock, skb, 0, 1, GFP_KERNEL);
}
}
complete(&exit_completion);
return 0;
}
static int netlink_exam_readproc(char *page, char **start, off_t off,
int count, int *eof, void *data)
{
int len;
if (off 》= buffer_tail) {
* eof = 1;
return 0;
}
else {
len = count;
if (count 》 PAGE_SIZE) {
len = PAGE_SIZE;
}
if (len 》 buffer_tail - off) {
len = buffer_tail - off;
}
memcpy(page, buffer + off, len);
*start = page;
return len;
}
}
static int __init netlink_exam_init(void)
{
netlink_exam_sock = netlink_kernel_create(NETLINK_GENERIC, 0, recv_handler, THIS_MODULE);
if (!netlink_exam_sock) {
printk(“Fail to create netlink socket.\n”);
return 1;
}
kernel_thread(process_message_thread, NULL, CLONE_KERNEL);
create_proc_read_entry(“netlink_exam_buffer”, 0444, NULL, netlink_exam_readproc, 0);
return 0;
}
static void __exit netlink_exam_exit(void)
{
exit_flag = 1;
wake_up(netlink_exam_sock-》sk_sleep);
wait_for_completion(&exit_completion);
sock_release(netlink_exam_sock-》sk_socket);
}
module_init(netlink_exam_init);
module_exit(netlink_exam_exit);
MODULE_LICENSE(“GPL”);
netlink-exam-user-send.c:
//application sender: netlink-exam-user-send.c
#include 《stdio.h》
#include 《sys/types.h》
#include 《sys/socket.h》
#include 《linux/netlink.h》
#define MAX_MSGSIZE 1024
int main(int argc, char * argv[])
{
FILE * fp;
struct sockaddr_nl saddr, daddr;
struct nlmsghdr *nlhdr = NULL;
struct msghdr msg;
struct iovec iov;
int sd;
char text_line[MAX_MSGSIZE];
int ret = -1;
if (argc 《 2) {
printf(“Usage: %s atextfilename\n”, argv[0]);
exit(1);
}
if ((fp = fopen(argv[1], “r”)) == NULL) {
printf(“File %s dosen‘t exist.\n”);
exit(1);
}
sd = socket(AF_NETLINK, SOCK_RAW,NETLINK_GENERIC);
memset(&saddr, 0, sizeof(saddr));
memset(&daddr, 0, sizeof(daddr));
saddr.nl_family = AF_NETLINK;
saddr.nl_pid = getpid();
saddr.nl_groups = 0;
bind(sd, (struct sockaddr*)&saddr, sizeof(saddr));
daddr.nl_family = AF_NETLINK;
daddr.nl_pid = 0;
daddr.nl_groups = 0;
nlhdr = (struct nlmsghdr *)malloc(NLMSG_SPACE(MAX_MSGSIZE));
while (fgets(text_line, MAX_MSGSIZE, fp)) {
memcpy(NLMSG_DATA(nlhdr), text_line, strlen(text_line));
memset(&msg, 0 ,sizeof(struct msghdr));
nlhdr-》nlmsg_len = NLMSG_LENGTH(strlen(text_line));
nlhdr-》nlmsg_pid = getpid(); /* self pid */
nlhdr-》nlmsg_flags = 0;
iov.iov_base = (void *)nlhdr;
iov.iov_len = nlhdr-》nlmsg_len;
msg.msg_name = (void *)&daddr;
msg.msg_namelen = sizeof(daddr);
msg.msg_iov = &iov;
msg.msg_iovlen = 1;
ret = sendmsg(sd, &msg, 0);
if (ret == -1) {
perror(“sendmsg error:”);
}
}
close(sd);
}
netlink-exam-user-recv.c:
//application receiver: netlink-exam-user-recv.c
#include 《stdio.h》
#include 《sys/types.h》
#include 《sys/socket.h》
#include 《linux/netlink.h》
#define MAX_MSGSIZE 1024
int main(void)
{
struct sockaddr_nl saddr, daddr;
struct nlmsghdr *nlhdr = NULL;
struct msghdr msg;
struct iovec iov;
int sd;
int ret = 1;
sd = socket(AF_NETLINK, SOCK_RAW,NETLINK_GENERIC);
memset(&saddr, 0, sizeof(saddr));
memset(&daddr, 0, sizeof(daddr));
saddr.nl_family = AF_NETLINK;
saddr.nl_pid = getpid();
saddr.nl_groups = 1;
bind(sd, (struct sockaddr*)&saddr, sizeof(saddr));
nlhdr = (struct nlmsghdr *)malloc(NLMSG_SPACE(MAX_MSGSIZE));
while (1) {
memset(nlhdr, 0, NLMSG_SPACE(MAX_MSGSIZE));
iov.iov_base = (void *)nlhdr;
iov.iov_len = NLMSG_SPACE(MAX_MSGSIZE);
msg.msg_name = (void *)&daddr;
msg.msg_namelen = sizeof(daddr);
msg.msg_iov = &iov;
msg.msg_iovlen = 1;
ret = recvmsg(sd, &msg, 0);
if (ret == 0) {
printf(“Exit.\n”);
exit(0);
}
else if (ret == -1) {
perror(“recvmsg:”);
exit(1);
}
printf(“%s”, NLMSG_DATA(nlhdr));
}
close(sd);
}
評(píng)論
查看更多