為了理解 TCP keepalive的作用。我們需要清楚,當(dāng)TCP的Peer A ,Peer B 兩端建立了連接之后,如果一端突然拔掉網(wǎng)線或拔掉電源時(shí),怎么檢測到拔掉網(wǎng)線或者拔掉電源、鏈路不通?原因是在需要長連接的網(wǎng)絡(luò)通信程序中,經(jīng)常需要心跳檢測機(jī)制,來實(shí)現(xiàn)檢測對方是否在線或者維持網(wǎng)絡(luò)連接的需要。
什么是 TCP 保活?
當(dāng)你建立一個(gè) TCP 連接時(shí),你關(guān)聯(lián)了一組定時(shí)器。其中一些計(jì)時(shí)器處理保活過程。當(dāng)保活計(jì)時(shí)器達(dá)到零時(shí),向?qū)Φ确桨l(fā)送一個(gè)保活探測數(shù)據(jù)包,其中沒有數(shù)據(jù)并且 ACK 標(biāo)志打開。
由于 TCP/IP 規(guī)范,可以這樣做,作為一種重復(fù)的 ACK,并且遠(yuǎn)程端點(diǎn)將沒有參數(shù),因?yàn)?TCP 是面向流的協(xié)議。另一方面,將收到來自遠(yuǎn)程主機(jī)的回復(fù),沒有數(shù)據(jù)和ACK 集。
如果收到對 keepalive 探測的回復(fù),則可以斷言連接仍在運(yùn)行。事實(shí)上,TCP 允許處理流,而不是數(shù)據(jù)包,因此零長度數(shù)據(jù)包對用戶程序沒有危險(xiǎn)。
此過程很有用,因?yàn)槿绻渌麑Φ确绞ミB接(例如通過重新啟動),即使沒有流量,也會注意到連接已斷開。如果對等方未回復(fù) keepalive 探測,可以斷言連接不能被視為有效,然后采取正確的操作。
為什么要使用 TCP keepalive?
1、檢查死節(jié)點(diǎn) 2、 防止因網(wǎng)絡(luò)不活動而斷開連接
檢查死節(jié)點(diǎn)
想一想 Peer A 和 Peer B 之間的簡單 TCP 連接:初始的三次握手,從 A 到 B 的一個(gè) SYN 段,從 B 到 A 的 SYN/ACK,以及從 A 到 B 的最終 ACK。
此時(shí),我們處于穩(wěn)定狀態(tài):連接已建立,現(xiàn)在我們通常會等待有人通過通道發(fā)送數(shù)據(jù)。
那么問題來了:從 B 上拔下電源,它會立即斷電,而不會通過網(wǎng)絡(luò)發(fā)送任何信息來通知 A 連接將斷開。
從它的角度來看,A 已準(zhǔn)備好接收數(shù)據(jù),并且不知道 B 已經(jīng)崩潰。現(xiàn)在恢復(fù)B的電源,等待系統(tǒng)重啟。A 和 B 現(xiàn)在又回來了,但是當(dāng) A 知道與 B 仍然處于活動狀態(tài)的連接時(shí),B 不知道。當(dāng) A 嘗試通過死連接向 B 發(fā)送數(shù)據(jù)時(shí),情況自行解決,B 回復(fù) RST 數(shù)據(jù)包,導(dǎo)致 A 最終關(guān)閉連接。
_____ _____
| | | |
| A | | B |
|_____| |_____|
^ ^
|--- >--- >--- >-------------- SYN -------------- >--- >--- >---|
|---< ---< ---< ------------ SYN/ACK ------------< ---< ---< ---|
|--- >--- >--- >-------------- ACK -------------- >--- >--- >---|
| |
| system crash --- > X
|
| system restart --- > ^
| |
|--- >--- >--- >-------------- PSH -------------- >--- >--- >---|
|---< ---< ---< -------------- RST --------------< ---< ---< ---|
| |
Keepalive 可以告訴您何時(shí)無法訪問另一個(gè)對等點(diǎn),而不會出現(xiàn)誤報(bào)的風(fēng)險(xiǎn)。
防止因網(wǎng)絡(luò)不活動而斷開連接
keepalive 的另一個(gè)有用目標(biāo)是防止不活動斷開通道。當(dāng)你在 NAT 代理或防火墻后面時(shí),無緣無故斷開連接是一個(gè)非常常見的問題。這種行為是由代理和防火墻中實(shí)現(xiàn)的連接跟蹤過程引起的,它們跟蹤通過它們的所有連接。
它們跟蹤通過它們的所有連接。由于這些機(jī)器的物理限制,它們只能在內(nèi)存中保留有限數(shù)量的連接。最常見和合乎邏輯的策略是保持最新的連接并首先丟棄舊的和不活動的連接。
_____ _____ _____
| | | | | |
| A | | NAT | | B |
|_____| |_____| |_____|
^ ^ ^
|--- >--- >--- >---|----------- SYN ------------- >--- >--- >---|
|---< ---< ---< ---|--------- SYN/ACK -----------< ---< ---< ---|
|--- >--- >--- >---|----------- ACK ------------- >--- >--- >---|
| | |
| | < --- connection deleted from table |
| | |
|--- >- PSH - >---| < --- invalid connection |
| | |
Linux下使用TCP keepalive
Linux 內(nèi)置了對 keepalive 的支持。涉及 keepalive 的過程使用三個(gè)用戶驅(qū)動的變量,可以使用 cat 查看參數(shù)值。
前兩個(gè)參數(shù)以秒表示,最后一個(gè)是純數(shù)字。這意味著keepalive 例程在發(fā)送第一個(gè)keepalive 探測之前等待兩個(gè)小時(shí)(7200 秒),然后每75 秒重新發(fā)送一次。如果連續(xù)9次沒有收到 ACK 響應(yīng),則連接被標(biāo)記為斷開。
修改這個(gè)值很簡單,可以這樣修改:
echo 7000 > /proc/sys/net/ipv4/tcp_keepalive_time echo 40 > /proc/sys/net/ipv4/tcp_keepalive_intvl echo 10 > /proc/sys/net/ipv4/tcp_keepalive_probes
還有另一種訪問內(nèi)核變量的方法,使用 sysctl 命令
setsockopt 、getsockopt 函數(shù)調(diào)用
在 Linux 操作系統(tǒng)中,我們可以通過代碼啟用一個(gè) socket 的心跳檢測,為特定套接字啟用 keepalive 所需要做的就是在套接字本身上設(shè)置特定的套接字選項(xiàng)。函數(shù)原型如下:
int getsockopt(int sockfd, int level, int optname,
void *optval, socklen_t *optlen);
int setsockopt(int sockfd, int level, int optname,
const void *optval, socklen_t optlen);
第一個(gè)參數(shù)是socket;第二個(gè)必須是 SOL_SOCKET,第三個(gè)必須是 SO_KEEPALIVE。第四個(gè)參數(shù)必須是布爾整數(shù)值,表示我們要啟用該選項(xiàng),而最后一個(gè)是之前傳遞的值的大小。
在編寫應(yīng)用程序時(shí),還可以為 keepalive 設(shè)置其他三個(gè)套接字選項(xiàng)。它們都使用 SOL_TCP 級別而不是 SOL_SOCKET,并且它們僅針對當(dāng)前套接字覆蓋系統(tǒng)范圍的變量。如果不先寫入就讀取,將返回當(dāng)前系統(tǒng)范圍的參數(shù)。
TCP_KEEPCNT:覆蓋 tcp_keepalive_probes
TCP_KEEPIDLE:覆蓋 tcp_keepalive_time
TCP_KEEPINTVL:覆蓋 tcp_keepalive_intvl
TCP keepalive 代碼實(shí)現(xiàn)
在寫TCP keepalive 服務(wù)程序時(shí),除了要處理SIGPIPE外,還要有客戶端連接檢測機(jī)制,用于及時(shí)發(fā)現(xiàn)崩潰的客戶端連接。我們使用TCP的 keepalive 機(jī)制方式。
tcp_keepalive_client:
int main(int argc, char *argv[])
{
kat_arg0 = basename(argv[0]);
bzero(&cp, sizeof (cp));
cp.cp_keepalive = 1;
cp.cp_keepidle = -1;
cp.cp_keepcnt = -1;
cp.cp_keepintvl = -1;
while ((c = getopt(argc, argv, ":c:d:i:")) != -1) {
switch (c) {
case 'c':
cp.cp_keepcnt = parse_positive_int_option(
optopt, optarg);
break;
case 'd':
cp.cp_keepidle = parse_positive_int_option(
optopt, optarg);
break;
case 'i':
cp.cp_keepintvl = parse_positive_int_option(
optopt, optarg);
break;
case ':':
warnx("option requires an argument: -%c", optopt);
usage();
break;
case '?':
warnx("unrecognized option: -%c", optopt);
usage();
break;
}
}
if (optind > argc - 1) {
warnx("missing required arguments");
usage();
}
ipport = argv[optind++];
if (parse_ip4port(ipport, &cp.cp_ip) == -1) {
warnx("invalid IP/port: "%s"", ipport);
usage();
}
(void) fprintf(stderr, "going connect to: %s port %dn",
inet_ntoa(cp.cp_ip.sin_addr), ntohs(cp.cp_ip.sin_port));
(void) fprintf(stderr, "set SO_KEEPALIVE = %dn", cp.cp_keepalive);
(void) fprintf(stderr, "set TCP_KEEPIDLE = %dn", cp.cp_keepidle);
(void) fprintf(stderr, "set TCP_KEEPCNT = %dn", cp.cp_keepcnt);
(void) fprintf(stderr, "set TCP_KEEPINTVL = %dn", cp.cp_keepintvl);
rv = connectandwait(&cp);
return (rv == 0 ? EXIT_SUCCESS : EXIT_FAILURE);
}
tcp_keepalive_server:
int main(int argc, char *argv[] )
{
/* 創(chuàng)建套接字 */
if((listen_sock = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP)) < 0) {
perror("socket()");
exit(EXIT_FAILURE);
}
/* 檢查 keepalive 選項(xiàng)的狀態(tài) */
if(getsockopt(listen_sock, SOL_SOCKET, SO_KEEPALIVE, &optval, &optlen) < 0) {
perror("getsockopt()");
close(listen_sock);
exit(EXIT_FAILURE);
}
printf("SO_KEEPALIVE default is %sn", (optval ? "ON" : "OFF"));
/* 將選項(xiàng)設(shè)置為活動 */
optval = 1;
optlen = sizeof(optval);
if(setsockopt(listen_sock, SOL_SOCKET, SO_KEEPALIVE, &optval, optlen) < 0) {
perror("setsockopt()");
close(listen_sock);
exit(EXIT_FAILURE);
}
printf("SO_KEEPALIVE set on socketn");
/* 再次檢查狀態(tài) */
if(getsockopt(listen_sock, IPPROTO_TCP, TCP_KEEPIDLE, &optval, &optlen) < 0) {
perror("getsockopt()");
close(listen_sock);
exit(EXIT_FAILURE);
}
printf("TCP_KEEPIDLE is %dn", optval );
/* 再次檢查狀態(tài) */
if(getsockopt(listen_sock, IPPROTO_TCP, TCP_KEEPCNT, &optval, &optlen) < 0) {
perror("getsockopt()");
close(listen_sock);
exit(EXIT_FAILURE);
}
printf("TCP_KEEPCNT is %dn", optval);
/* 再次檢查狀態(tài) */
if(getsockopt(listen_sock, IPPROTO_TCP, TCP_KEEPINTVL, &optval, &optlen) < 0) {
perror("getsockopt()");
close(listen_sock);
exit(EXIT_FAILURE);
}
printf("TCP_KEEPINTVL is %dn", optval );
/* 初始化套接字結(jié)構(gòu) */
bzero((char *) &serv_addr, sizeof(serv_addr));
int portno = atoi(argv[1]);
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = INADDR_ANY;
serv_addr.sin_port = htons(portno);
...
}
程序創(chuàng)建一個(gè) TCP 套接字并將 SO_KEEPALIVE 套接字選項(xiàng)設(shè)置為 1。如果指定了“-c”、“-d”和“-i”選項(xiàng)中的任何一個(gè),則設(shè)置 TCP_KEEPCNT、TCP_KEEPIDLE 和 TCP_KEEPINTVL 套接字選項(xiàng) 在相應(yīng)選項(xiàng)參數(shù)的套接字上。
通過測試程序,我們可以使用tcpdump、或者tshark是命令行抓包工具,來分析KeepAlive。
tshark -nn -i lo port 5050 tcpdump -nn -i lo port 5050
tcpdump -nn -i lo port 5050
整個(gè)keepalive過程很簡單,就是client給server發(fā)送一個(gè)包,server返回給用戶一個(gè)包。注意包內(nèi)沒有數(shù)據(jù),只有ACK標(biāo)識 被打開。
ps -aux | grep tcp_keepalive
總結(jié)
keepalive 是一個(gè)設(shè)備向另一個(gè)設(shè)備發(fā)送的消息,用于檢查兩者之間的鏈路是否正在運(yùn)行,或防止鏈路中斷。
-
電源
+關(guān)注
關(guān)注
184文章
17797瀏覽量
250989 -
TCP
+關(guān)注
關(guān)注
8文章
1374瀏覽量
79157 -
程序
+關(guān)注
關(guān)注
117文章
3793瀏覽量
81214 -
網(wǎng)絡(luò)通信
+關(guān)注
關(guān)注
4文章
809瀏覽量
29860
發(fā)布評論請先 登錄
相關(guān)推薦
評論