cut命令在Linux和Unix中的作用是從文件中的每一行中截取出一些部分,并輸出到標準輸出中。我們可以使用cut命令從一行字符串中于以字節,字符,字段(分隔符)等單位截取一部分內容出來。
在本文中,我們通過一些例子來了解cut命令的使用,這些使用方法在我們的日常工作中也是非常常用的。
Cut 命令和語法
cut命令的基本語法如下:
$ cut OPTION... [FILE]...
我們先來了解一下cut的一些選項,cut命令必須要指定選項才能執行。
-f: 提取指定的字段,cut命令使用Tab作為默認的分隔符。
-d:Tab是默認的分隔符,使用這一選項可以指定自己的分隔符。
-b: 提取指定的字節,也可以指定一個范圍。
-c: 提取指定的字符,可以是以逗號分隔的數字的列表,也可以是以連字符分隔的數字的范圍。
–complement: 補充選中的部分,即反選。
–output-delimiter: 修改輸出時使用的分隔符。
--only-delimited: 不輸出不包含分隔符的列。
我們以如下的名為context.txt的文本文件和/etc/passwd文件來為例來進行說明。
$ cat content.txt Ubuntu LinuxMicrosoft WindowsOsX El CapitanUnixFreeBSD
如何指定分隔符
最常用的選項是-d和-f的組合,這會根據-d指定的分隔符和-f列出的字段來提取內容。
例如在這個例子中只打印出 /etc/passwd 文件每一行的第一個字段,用的分隔符是:
$ cut -d':' -f1 /etc/passwdrootbindaemonadmlpsyncshutdownhaltmailoperatorgamesalvinliangxu...
在下面這個例子中我們用空格作為分隔符打印 content.txt 文件的第一個字段
$ cut -d " " -f 1 content.txt UbuntuMicrosoftOsXUnixFreeBSD
在下面這個例子中我們提取了多個字段。這里,我們使用冒號(:)分隔符從文件 /etc/passwd 中包含字符串 /bin/bash 的行提取第一和第六個字段。
$ grep "/bin/bash" /etc/passwd | cut -d':' -f1,6root:/rootalvin:/home/alvin
要顯示字段的某個范圍,可以指定開始和結束的字段,中間用連字符(-)連接,如下所示:
$ grep "/bin/bash" /etc/passwd | cut -d':' -f1-4,6,7root0/root:/bin/bashalvin1000/home/alvin:/bin/bash
如何補全選擇的輸出
要補全選擇輸出的字段(即反選),使用--complement選項。這一選項輸出所有的字段,除了指定的字段。
在下面這個例子中輸出 /etc/passwd 文件中包含 /bin/bash 的行中除了第二個字段以外的所有字段:
$ grep "/bin/bash" /etc/passwd | cut -d':' --complement -f2root0/root:/bin/bash
如何指定輸出的分隔符
使用--output-delimiter可以指定輸出的分隔符。輸入的分隔符由-d來指定,而輸出分隔符和輸入分隔符默認是一樣的。
我們先以下面的例子來測試不指定輸出分隔符時的輸出;
$ cut -d: -f1,7 /etc/passwd | sort | uniq -u_apt:/usr/sbin/nologinbackup:/usr/sbin/nologinbin:/usr/sbin/nologindaemon:/usr/sbin/nologindnsmasq:/usr/sbin/nologingames:/usr/sbin/nologingnats:/usr/sbin/nologinirc:/usr/sbin/nologinlandscape:/usr/sbin/nologinlist:/usr/sbin/nologinlp:/usr/sbin/nologinlxd:/bin/false
現在我們加上--output-delimiter選項,將輸出分隔符指定為空格:
$ cut -d: -f1,7 --output-delimiter ' ' /etc/passwd | sort | uniq -u_apt /usr/sbin/nologinbackup /usr/sbin/nologinbin /usr/sbin/nologindaemon /usr/sbin/nologindnsmasq /usr/sbin/nologingames /usr/sbin/nologingnats /usr/sbin/nologinirc /usr/sbin/nologinlandscape /usr/sbin/nologinlist /usr/sbin/nologinlp /usr/sbin/nologinlxd /bin/false
我們再測試一個例子,用分隔符讓每一行打印一個字段。
我們將--output-delimiter指定為$' '表換行。
輸出結果為:
$ grep root /etc/passwd | cut -d':' -f1,6,7 --output-delimiter=$' 'root/root/bin/bashoperator/root/sbin/nologin
如何以字符的方式提取內容
-c選項可以用來根據字符位置進行提取,注意空格和Tab也以字符來處理。
打印 context.txt 文件每一行的第一個字符,如下:
$ cut -c 1 content.txtUMOUF
下面顯示了 context.txt 文件每一行的第一至七個字符;
$ cut -c 1-7 content.txtUbuntuMicrosoOsX ElUnixFreeBSD
我們再測試一下只指定開始或結束的位置。
下面提取第二個到最后一個字符:
$ cut -c2- content.txtbuntu Linuxicrosoft WindowssX El CapitannixreeBSD
提取第一到第四個字符:
cut -c-4 content.txtUbunMicrOsXUnixFree
如何根據字節提取
使用-b選項通過指定字節的位置來選擇一行的某一部分,使用逗號分隔每個指定位置,或用連字符-指定一個范圍。
下面這個例子提取 content.txt 文件每一行的第一,二,三個字節:
$ cut -b 1,2,3 content.txt UbuMicOsXUniFre
我們也可以用如下命令列出一個范圍;
$ cut -b 1-3,5-7 content.txt Ubutu MicosoOsXEl UniFreBSD
一些實用的例子
cut是一個實用的命令,常常和其他Linux或Unix命令結合使用 。
例如如果你想提取 ps 命令中的 USER,PID和COMMAND:
ps -L u n | tr -s " " | cut -d " " -f 2,3,14-USER PID COMMAND0 676 /sbin/agetty -o -p -- u --keep-baud 115200,38400,9600 ttyS0 vt2200 681 /sbin/agetty -o -p -- u --noclear tty1 linux0 23174 -bash0 26737 ps -L u n0 26738 tr -s0 26739 cut -d -f 2,3,14-
再測試一個例子,提取內存的 total,used和free值,并保存到一個文件中。
$ free -m | tr -s ' ' | sed '/^Mem/!d' | cut -d" " -f2-4 >> memory.txt$ cat memory.txt985 86 234
總結
cut命令可以和很多其他Linux或Unix命令通過管道連接。可以通過管道傳遞一個或多個過濾器進行額外的文本處理。
cut命令的局限性之一是它不支持指定多個字符作為分隔符。多個空格會被計算為多個字段分隔符,因此必須在cut命令前使用tr命令才能獲得需要的輸出。
-
Linux
+關注
關注
87文章
11325瀏覽量
209954 -
UNIX
+關注
關注
0文章
296瀏覽量
41513 -
TAB
+關注
關注
0文章
16瀏覽量
11565
原文標題:Linux cut 命令詳解
文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論