在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于標準的Linux命令行工具

電子工程師 ? 來源:良許Linux ? 作者:良許Linux ? 2022-08-08 14:22 ? 次閱讀

	

	

當你發現 Linux 服務器上的系統性能問題,在最開始的 1 分鐘時間里,你會查看哪些系統指標呢?

Netflix 在 AWS 上有著大規模的 EC2 集群,以及各種各樣的性能分析和監控工具。比如我們使用 Atlas 來監控整個平臺,用 Vector 實時分析 EC2 實例的性能。這些工具已經能夠幫助我們解決大部分的問題,但是有時候我們還是要登錄進機器內部,用一些標準的 Linux 性能分析工具來定位問題。

在這篇文章里,Netflix 性能工程團隊會介紹一些我們使用的標準的 Linux 命令行工具,在發現問題的前 60 秒內去分析和定位問題。

在這 60 秒內,你可以使用下面這 10 個命令行了解系統整體的運行情況,以及當前運行的進程對資源的使用情況。

在這些指標里面,我們先關注和錯誤、以及和資源飽和率相關的指標,然后再看資源使用率。相對來講,錯誤和資源飽和率比較容易理解。飽和的意思是指一個資源(CPU,內存,磁盤)上的負載超過了它能夠處理的能力,這時候我們觀察到的現象就是請求隊列開始堆積,或者請求等待的時間變長。


		

uptime dmesg | tail vmstat 1 mpstat -P ALL 1 pidstat 1 iostat -xz 1 free -m sar -n DEV 1 sar -n TCP,ETCP 1 top

有些命令行依賴于 sysstat 包。通過這些命令行的使用,你可以熟悉一下分析系統性能問題時常用的一套方法或者流程:USE 。這個方法主要從資源使用率(Utilization)、資源飽和度(Satuation)、錯誤(Error),這三個方面對所有的資源進行分析(CPU,內存,磁盤等等)。

在這個分析的過程中,我們也要時刻注意我們已經排除過的資源問題,以便縮小我們定位的范圍,給下一步的定位提供更明確的方向。

下面的章節對每個命令行做了一個說明,并且使用了我們在生產環境的數據作為例子。對這些命令行更詳細的描述,請查看相應的幫助文檔。

1.uptime


		

$ uptime

這個命令能很快地檢查系統平均負載,你可以認為這個負載的值顯示的是有多少任務在等待運行。在 Linux 系統里,這包含了想要或者正在使用 CPU 的任務,以及在 io 上被阻塞的任務。這個命令能使我們對系統的全局狀態有一個大致的了解,但是我們依然需要使用其它工具獲取更多的信息

這三個值是系統計算的 1 分鐘、5 分鐘、15 分鐘的指數加權的動態平均值,可以簡單地認為就是這個時間段內的平均值。根據這三個值,我們可以了解系統負載隨時間的變化。比如,假設現在系統出了問題,你去查看這三個值,發現 1 分鐘的負載值比 15 分鐘的負載值要小很多,那么你很有可能已經錯過了系統出問題的時間點。

在上面這個例子里面,負載的平均值顯示 1 分鐘為 30,比 15 分鐘的 19 相比增長較多。有很多原因會導致負載的增加,也許是 CPU 不夠用了;vmstat 或者 mpstat 可以進一步確認問題在哪里。

2.dmesg | tail


	

		

$ dmesg | tail [1880957.563150] perl invoked oom-killer: gfp_mask=0x280da, order=0, oom_score_adj=0 [...] [1880957.563400] Out of memory: Kill process 18694 (perl) score 246 or sacrifice child [1880957.563408] Killed process 18694 (perl) total-vm:1972392kB, anon-rss:1953348kB, file-rss:0kB [2320864.954447] TCP: Possible SYN flooding on port 7001. Dropping request. Check SNMP count

這個命令顯示了最新的幾條系統日志。這里我們主要找一下有沒有一些系統錯誤會導致性能的問題。上面的例子包含了 oom-killer 以及 TCP 丟包。

不要略過這一步!dmesg 永遠值得看一看。

3. vmstat 1


		

$ vmstat 1 procs ---------memory---------- ---swap-- -----io---- -system-- ------cpu----- r b swpd free buff cache si so bi bo in cs us sy id wa st 34 0 0 200889792 73708 591828 0 0 0 5 6 10 96 1 3 0 0 32 0 0 200889920 73708 591860 0 0 0 592 13284 4282 98 1 1 0 0 32 0 0 200890112 73708 591860 0 0 0 0 9501 2154 99 1 0 0 0 32 0 0 200889568 73712 591856 0 0 0 48 11900 2459 99 0 0 0 0 32 0 0 200890208 73712 591860 0 0 0 0 15898 4840 98 1 1 0 0 ^C

vmstat 展示了虛擬內存、CPU 的一些情況。上面這個例子里命令行的 1 表示每隔 1 秒鐘顯示一次。在這個版本的 vmstat 里,第一行表示了這一次啟動以來的各項指標,我們可以暫時忽略掉第一行。

需要查看的指標:

  • r處在 runnable 狀態的任務,包括正在運行的任務和等待運行的任務。這個值比平均負載能更好地看出 CPU 是否飽和。這個值不包含等待 io 相關的任務。當 r 的值比當前 CPU 個數要大的時候,系統就處于飽和狀態了。

  • free以 KB 計算的空閑內存大小。

  • si,so換入換出的內存頁。如果這兩個值非零,表示內存不夠了。

  • us,sy,id,wa,stCPU 時間的各項指標(對所有 CPU 取均值),分別表示:用戶態時間,內核態時間,空閑時間,等待 io,偷取時間(在虛擬化環境下系統在其它租戶上的開銷)

把用戶態 CPU 時間(us)和內核態 CPU 時間(sy)加起來,我們可以進一步確認 CPU 是否繁忙。等待 IO 的時間(wa)高的話,表示磁盤是瓶頸;注意,這個也被包含在空閑時間里面(id), CPU 這個時候也是空閑的,任務此時阻塞在磁盤 IO 上了。你可以把等待 IO 的時間(wa)看做另一種形式的 CPU 空閑,它可以告訴你 CPU 為什么是空閑的。

系統處理 IO 的時候,肯定是會消耗內核態時間(sy)的。如果內核態時間較多的話,比如超過 20%,我們需要進一步分析,也許內核對 IO 的處理效率不高。

在上面這個例子里,CPU 時間大部分都消耗在了用戶態,表明主要是應用層的代碼在使用 CPU。CPU 利用率(us + sy)也超過了 90%,這不一定是一個問題;我們可以通過 r 和 CPU 個數確定 CPU 的飽和度。

4. mpstat -P ALL 1


	

		

$ mpstat -P ALL 1 Linux 3.13.0-49-generic (titanclusters-xxxxx) 07/14/2015 _x86_64_ (32 CPU) 0749 PM CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle 0750 PM all 98.47 0.00 0.75 0.00 0.00 0.00 0.00 0.00 0.00 0.78 0750 PM 0 96.04 0.00 2.97 0.00 0.00 0.00 0.00 0.00 0.00 0.99 0750 PM 1 97.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 2.00 0750 PM 2 98.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 1.00 0750 PM 3 96.97 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 3.03 [...]

這個命令把每個 CPU 的時間都打印出來,可以看看 CPU 對任務的處理是否均勻。比如,如果某一單個 CPU 使用率很高的話,說明這是一個單線程應用。

5. pidstat 1


	

		

$ pidstat 1 Linux 3.13.0-49-generic (titanclusters-xxxxx) 07/14/2015 _x86_64_ (32 CPU) 0702 PM UID PID %usr %system %guest %CPU CPU Command 0703 PM 0 9 0.00 0.94 0.00 0.94 1 rcuos/0 0703 PM 0 4214 5.66 5.66 0.00 11.32 15 mesos-slave 0703 PM 0 4354 0.94 0.94 0.00 1.89 8 java 0703 PM 0 6521 1596.23 1.89 0.00 1598.11 27 java 0703 PM 0 6564 1571.70 7.55 0.00 1579.25 28 java 0703 PM 60004 60154 0.94 4.72 0.00 5.66 9 pidstat 0703 PM UID PID %usr %system %guest %CPU CPU Command 0704 PM 0 4214 6.00 2.00 0.00 8.00 15 mesos-slave 0704 PM 0 6521 1590.00 1.00 0.00 1591.00 27 java 0704 PM 0 6564 1573.00 10.00 0.00 1583.00 28 java 0704 PM 108 6718 1.00 0.00 0.00 1.00 0 snmp-pass 0704 PM 60004 60154 1.00 4.00 0.00 5.00 9 pidstat ^C

pidstat 和 top 很像,不同的是它可以每隔一個間隔打印一次,而不是像 top 那樣每次都清屏。這個命令可以方便地查看進程可能存在的行為模式,你也可以直接 copy past,可以方便地記錄隨著時間的變化,各個進程運行狀況的變化。

上面的例子說明有 2 個 Java 進程消耗了大量 CPU。這里的 %CPU 表明的是對所有 CPU 的值,比如 1591% 標識這個 Java 進程幾乎消耗了 16 個 CPU。

6. iostat -xz 1


	

		

$ iostat -xz 1 Linux 3.13.0-49-generic (titanclusters-xxxxx) 07/14/2015 x86_64 (32 CPU) avg-cpu: %user %nice %system %iowait %steal %idle 73.96 0.00 3.73 0.03 0.06 22.21 Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util xvda 0.00 0.23 0.21 0.18 4.52 2.08 34.37 0.00 9.98 13.80 5.42 2.44 0.09 xvdb 0.01 0.00 1.02 8.94 127.97 598.53 145.79 0.00 0.43 1.78 0.28 0.25 0.25 xvdc 0.01 0.00 1.02 8.86 127.79 595.94 146.50 0.00 0.45 1.82 0.30 0.27 0.26 dm-0 0.00 0.00 0.69 2.32 10.47 31.69 28.01 0.01 3.23 0.71 3.98 0.13 0.04 dm-1 0.00 0.00 0.00 0.94 0.01 3.78 8.00 0.33 345.84 0.04 346.81 0.01 0.00 dm-2 0.00 0.00 0.09 0.07 1.35 0.36 22.50 0.00 2.55 0.23

iostat 是理解塊設備(磁盤)的當前負載和性能的重要工具。幾個指標的含義:

  • r/s,w/s,rkB/s,wkB/s系統發往設備的每秒的讀次數、每秒寫次數、每秒讀的數據量、每秒寫的數據量。這幾個指標反映的是系統的工作負載。系統的性能問題很有可能就是負載太大。

  • await系統發往 IO 設備的請求的平均響應時間。這包括請求排隊的時間,以及請求處理的時間。超過經驗值的平均響應時間表明設備處于飽和狀態,或者設備有問題。

  • avgqu-sz設備請求隊列的平均長度。隊列長度大于 1 表示設備處于飽和狀態。

  • %util設備利用率。設備繁忙的程度,表示每一秒之內,設備處理 IO 的時間占比。大于 60% 的利用率通常會導致性能問題(可以通過 await 看到),但是每種設備也會有有所不同。接近 100% 的利用率表明磁盤處于飽和狀態。

如果這個塊設備是一個邏輯塊設備,這個邏輯快設備后面有很多物理的磁盤的話,100% 利用率只能表明有些 IO 的處理時間達到了 100%;后端的物理磁盤可能遠遠沒有達到飽和狀態,可以處理更多的負載。

還有一點需要注意的是,較差的磁盤 IO 性能并不一定意味著應用程序會有問題。應用程序可以有許多方法執行異步 IO,而不會阻塞在 IO 上面;應用程序也可以使用諸如預讀取,寫緩沖等技術降低 IO 延遲對自身的影響。

7. free -m


		

$ free -m total used free shared buffers cachedMem: 245998 24545 221453 83 59 541-/+ buffers/cache: 23944 222053Swap:

右邊的兩列顯式:

  • buffers:用于塊設備 I/O 的緩沖區緩存。

  • cached:用于文件系統的頁面緩存。

我們只是想要檢查這些不接近零的大小,其可能會導致更高磁盤 I/O(使用 iostat 確認),和更糟糕的性能。上面的例子看起來還不錯,每一列均有很多 M 個大小。

比起第一行,-/+ buffers/cache 提供的內存使用量會更加準確些。Linux 會把暫時用不上的內存用作緩存,一旦應用需要的時候就立刻重新分配給它。所以部分被用作緩存的內存其實也算是空閑的內存。為了解釋這一點, 甚至有人專門建了個網站:http://www.linuxatemyram.com/。

如果使用 ZFS 的話,可能會有點困惑。ZFS 有自己的文件系統緩存,在 free -m 里面看不到;系統看起來空閑內存不多了,但是有可能 ZFS 有很多的緩存可用。

8. sar -n DEV 1


		

$ sar -n DEV 1 Linux 3.13.0-49-generic (titanclusters-xxxxx) 07/14/2015 _x86_64_ (32 CPU) 1248 AM IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s %ifutil 1249 AM eth0 18763.00 5032.00 20686.42 478.30 0.00 0.00 0.00 0.00 1249 AM lo 14.00 14.00 1.36 1.36 0.00 0.00 0.00 0.00 1249 AM docker0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1249 AM IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s %ifutil 1250 AM eth0 19763.00 5101.00 21999.10 482.56 0.00 0.00 0.00 0.00 1250 AM lo 20.00 20.00 3.25 3.25 0.00 0.00 0.00 0.00 1250 AM docker0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 ^C

這個工具可以查看網絡接口的吞吐量:rxkB/s 和 txkB/s 可以測量負載,也可以看是否達到網絡流量限制了。在上面的例子里,eth0 的吞吐量達到了大約 22 Mbytes/s,差不多 176 Mbits/sec ,比 1 Gbit/sec 還要少很多。

這個例子里也有 %ifutil 標識設備利用率,我們也用 Brenan 的 nicstat tool 測量。和 nicstat 一樣,這個設備利用率很難測量正確,上面的例子里好像這個值還有點問題。

9. sar -n TCP,ETCP 1


	

		

$ sar -n TCP,ETCP 1 Linux 3.13.0-49-generic (titanclusters-xxxxx) 07/14/2015 _x86_64_ (32 CPU) 1219 AM active/s passive/s iseg/s oseg/s 1220 AM 1.00 0.00 10233.00 18846.00 1219 AM atmptf/s estres/s retrans/s isegerr/s orsts/s 1220 AM 0.00 0.00 0.00 0.00 0.00 1220 AM active/s passive/s iseg/s oseg/s 1221 AM 1.00 0.00 8359.00 6039.00 1220 AM atmptf/s estres/s retrans/s isegerr/s orsts/s 1221 AM 0.00 0.00 0.00 0.00 0.00 ^C

這是對 TCP 重要指標的一些概括,包括:

  • active/s每秒鐘本地主動開啟的 TCP 連接,也就是本地程序使用 connect() 系統調用

  • passive/s每秒鐘從源端發起的 TCP 連接,也就是本地程序使用 accept() 所接受的連接

  • retrans/s每秒鐘的 TCP 重傳次數

  • atctive 和 passive 的數目通常可以用來衡量服務器的負載:接受連接的個數(passive),下游連接的個數(active)。可以簡單認為 active 為出主機的連接,passive 為入主機的連接;但這個不是很嚴格的說法,比如 loalhost 和 localhost 之間的連接。

重傳表示網絡或者服務器的問題。也許是網絡不穩定了,也許是服務器負載過重開始丟包了。上面這個例子表示每秒只有 1 個新連接建立。

10. top


		

$ top top - 0040 up 21:56, 1 user, load average: 31.09, 29.87, 29.92 Tasks: 871 total, 1 running, 868 sleeping, 0 stopped, 2 zombie %Cpu(s): 96.8 us, 0.4 sy, 0.0 ni, 2.7 id, 0.1 wa, 0.0 hi, 0.0 si, 0.0 st KiB Mem: 25190241+total, 24921688 used, 22698073+free, 60448 buffers KiB Swap: 0 total, 0 used, 0 free. 554208 cached Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 20248 root 20 0 0.227t 0.012t 18748 S 3090 5.2 29812:58 java 4213 root 20 0 2722544 64640 44232 S 23.5 0.0 233:35.37 mesos-slave 66128 titancl+ 20 0 24344 2332 1172 R 1.0 0.0 0:00.07 top 5235 root 20 0 38.227g 547004 49996 S 0.7 0.2 2:02.74 java 4299 root 20 0 20.015g 2.682g 16836 S 0.3 1.1 33:14.42 java 1 root 20 0 33620 2920 1496 S 0.0 0.0 0:03.82 init 2 root 20 0 0 0 0 S 0.0 0.0 0:00.02 kthreadd 3 root 20 0 0 0 0 S 0.0 0.0 0:05.35 ksoftirqd/0 5 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H

top 命令涵蓋了我們前面講述的許多指標。我們可以用它來看和我們之前查看的結果有沒有很大的不同,如果有的話,那表示系統的負載在變化。

top 的缺點就是你很難找到這些指標隨著時間的一些行為模式,在這種情況下,vmstat 或者 pidstat 這種可以提供滾動輸出的命令是更好的方式。如果你不以足夠快的速度暫停輸出(Ctrl-S 暫停,Ctrl-Q 繼續),一些間歇性問題的線索也可能由于被清屏而丟失。

審核編輯:彭靜

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10898

    瀏覽量

    212535
  • Linux
    +關注

    關注

    87

    文章

    11333

    瀏覽量

    210054
  • 服務器
    +關注

    關注

    12

    文章

    9272

    瀏覽量

    85814

原文標題:如何在 60 秒內優化提升 Linux 性能?只有 2% 的人知道

文章出處:【微信號:良許Linux,微信公眾號:良許Linux】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    在STM32實現命令行

    工作中的開發環境都是基于linux命令行交互,作為命令行的重度使用者,玩單片機也要使用命令行工具,百度了一些
    發表于 12-09 11:32 ?2497次閱讀

    Linux命令行工具

    Linux 新手往往對命令行心存畏懼。部分原因是因為需要記憶大量的命令,畢竟掌握命令是高效使用命令行的前提不幸的是,學習這些
    發表于 07-25 08:10

    linux命令行下載工具

    wget是linux下常用的命令行下載工具,是Linux用戶是必不可少的工具,尤其對于網絡管理員,經常要下載一些軟件。而tget是一個簡單的
    發表于 07-25 07:02

    Linux命令行的基本使用

    嵌入式Linux開發環境的構建,Linux命令行的基本使用,VI、GCC、Makefile基本工具的使用,交叉開發環境的使用。學習條件: 1.C語言編程基礎
    發表于 11-05 09:08

    實用 Linux 命令行使用技巧集錦

    下面介紹的都是一些命令行工具,這些工具在日常工作中都很有用。
    的頭像 發表于 03-21 14:42 ?4784次閱讀

    Xilinx軟件命令行工具:XSCT開發和調試

    了解如何使用XSCT,Xilinx軟件命令行工具進行開發和調試。 該視頻演示了XSCT如何充當Xilinx SDK的命令行控制臺。
    的頭像 發表于 11-21 06:02 ?1.4w次閱讀

    Xilinx軟件命令行工具進行開發和調試

    了解如何使用XSCT,Xilinx軟件命令行工具進行開發和調試。 該視頻演示了XSCT如何充當Xilinx SDK的命令行控制臺。
    的頭像 發表于 11-22 06:53 ?6754次閱讀

    Linux 命令行教程好書推薦

    今天跟大家推薦個 Linux 命令行教程:《The Linux Command Line》,中文譯名:《Linux 命令行大全》。 該書作者
    的頭像 發表于 02-14 09:25 ?1494次閱讀

    Golang基于flag庫實現一個命令行工具

    Golang 標準庫中的 flag 庫提供了解析命令行選項的能力,我們可以基于此來開發命令行工具
    的頭像 發表于 10-28 09:26 ?1331次閱讀

    Linux命令行與shell腳本編寫

    Linux命令行與shell腳本編寫
    發表于 01-11 16:50 ?4次下載

    如何使用命令行Linux中查找文件?

    終端,命令行提供了幾個用于搜索文件的工具,包括查找、定位、grep 和 where is,僅舉幾例。 那么如何使用命令行Linux中查找文件?在L
    的頭像 發表于 03-23 14:55 ?4288次閱讀

    linux命令行與shell編程實戰

    Linux命令行與Shell編程實戰主要涉及以下內容: Linux命令行基礎:學習Linux命令行
    的頭像 發表于 11-08 10:57 ?813次閱讀

    linux虛擬機怎么調出命令行

    Linux虛擬機中調出命令行界面,可以通過以下步驟實現: 打開虛擬機,進入到Linux系統。 在桌面或應用菜單中找到終端或命令行圖標,點擊打開。 輸入
    的頭像 發表于 11-08 11:28 ?3169次閱讀

    linux切換到命令行模式

    Linux中,可以通過以下步驟切換到命令行模式: 打開終端。可以在應用菜單中找到終端或命令行終端。 在終端中輸入命令“exit”或“logout”,然后按回車鍵。 系統會提示您輸入管
    的頭像 發表于 11-13 16:47 ?1827次閱讀

    linux命令行運行步驟

    運行Linux命令行涉及以下步驟: 打開終端 在Linux系統中,打開命令行界面的方式有多種,最常見的是打開終端應用程序。可以在應用程序菜單中找到終端,點擊打開。 熟悉
    的頭像 發表于 11-17 10:18 ?827次閱讀
    主站蜘蛛池模板: 美女扒开尿口给男的桶个爽| 国产在线播放一区| 九九热国产| 五月情婷婷| 天天色天天碰| 日美一级毛片| 2018天天操天天干| a级男女性高爱潮高清试| 97人洗澡人人澡人人爽| 好大好硬好深好爽视频h| 色wwww| 曰本福利写真片视频在线| 欧美aaaaaaaaaa| 中文在线最新版天堂bt| 天天久久影视色香综合网| 日本福利网址| 精品视频网站| 午夜神马影院| 加勒比日本在线| 一区二区三区四区五区| 窝窝视频成人影院午夜在线| 亚洲免费在线观看视频| 一级特黄aa大片免费播放视频| 婷婷激情六月| 毛色毛片| 中国特黄一级片| 女色窝人体色77777| 欧美夜夜| 色网站在线播放| 最新版天堂中文在线官网| 深爱婷婷| 国产三级影院| 欧美成人午夜毛片免费影院| caoporn成人免费公开| 熊出没之环球大冒险旧版免费观看| 欧美一区二区三区高清视频| 成人免费淫片95视频观看网站| 免费一级毛片在级播放| 国产午夜视频在线观看第四页| 亚洲欧洲第一页| 色婷婷六月|