對話 UNIX,第 8 部分: UNIX 進(jìn)程
在最近的街頭游樂會上,有一個單人樂隊(duì)讓我很是著迷。的確,這讓我很開心,還給我留下了深刻印象。這個單人樂隊(duì)的唯一成員利用嘴、大腿、膝蓋和腳分別控制口琴、五弦琴、鈸和腳鼓,生動地演奏了齊柏林飛船樂隊(duì)的《天堂的階梯》,他演奏的貝多芬《第五交響曲》也頗為動人。和他相比,我能一邊拍腦袋一邊摸肚子就覺得很不錯了。(或者是一邊拍肚子一邊摸腦袋。)
對您來說,幸運(yùn)的是,Unix® 操作系統(tǒng)更像是那個單人樂隊(duì),而不是像我這個笨手笨腳的專欄作家。UNIX 特別擅長同時處理多個任務(wù),并安排它們訪問系統(tǒng)中的有限資源(內(nèi)存、設(shè)備和 CPU)。打個比方,UNIX 可以一邊散步,一邊嚼口香糖。
這個月我們研究的內(nèi)容要比平常更深入一些,我們會看看 UNIX 是如何同時做這么多事的。這次我們還會探索 shell 的內(nèi)部,了解工作控制命令,如 Ctrl+C(終止)和 Ctrl+Z(掛起)是怎樣實(shí)現(xiàn)的。
一個真正的多任務(wù)系統(tǒng)
在 UNIX(以及大多數(shù)現(xiàn)代操作系統(tǒng),包括 Microsoft® Windows®、Mac OS X、FreeBSD 和 Linux®)中,每個計(jì)算任務(wù)都是由一個進(jìn)程表示的。UNIX 似乎能同時運(yùn)行很多任務(wù),這是因?yàn)槊總€進(jìn)程都會輪流(從概念上來講)分到一小片 CPU 時間。
一個進(jìn)程就像一個容器,它與某個正在運(yùn)行的應(yīng)用程序、環(huán)境變量、應(yīng)用程序的輸入和輸出,以及進(jìn)程的狀態(tài)(包括其優(yōu)先級和累計(jì)資源使用情況)捆綁在一起。圖 1 顯示了一個進(jìn)程。
圖 1. UNIX 進(jìn)程的概念化模型
為了便于理解,您可以把一個進(jìn)程想像成一個獨(dú)立的國家,有邊界、資源,還有國民生產(chǎn)總值。
每個進(jìn)程還有一個所有者。一般來說,您啟動的任務(wù)(如您的 shell 和命令)的所有者就是您。系統(tǒng)服務(wù)的所有者可能是特殊用戶或超級用戶 root。例如,為了增強(qiáng)安全性,Apache HTTP Server 的所有者一般是一個名為 www 的專用用戶,該用戶能提供 Web 服務(wù)器所需的的文件訪問權(quán)限,但不包含其他權(quán)限。
進(jìn)程的所有權(quán)可能會改變,但必須嚴(yán)格保持其獨(dú)占性。一個進(jìn)程在任何時候都只能有一個所有者。
最后,每個進(jìn)程都具有權(quán)限。一般來說,進(jìn)程的權(quán)限與其所有者的權(quán)限是相稱的。(例如,如果您無法在命令行 Shell 中訪問某個特定文件,則您從 Shell 中啟動的程序也會繼承同樣的限制。)這一繼承規(guī)則有一個例外情況,即應(yīng)用程序啟用了特殊的 setuid 或 setgid 位,如 ls 顯示的那樣,在此情況下,某個進(jìn)程可能會獲得比其所有者更高的權(quán)限。
setuid 位可以使用 chmod u+s 進(jìn)行設(shè)置。setuid 的權(quán)限如下所示:
$ ls -l /usr/bin/top-rwsr-xr-x 1 root wheel 83088 Mar 20 2005 top
setgid 位可以使用 chmod g+s 設(shè)置:
$ ls -l /usr/bin/top-r-xr-sr-x 1 root tty 19388 Mar 20 2005 /usr/bin/wall
一個 setuid 進(jìn)程(如啟動 top)是用擁有該文件的用戶權(quán)限運(yùn)行的。因此,當(dāng)您運(yùn)行 top 時,您的權(quán)限會被提升,與 root 的權(quán)限等同。類似地,一個 setgid 進(jìn)程是用與文件的組所有者相關(guān)聯(lián)的權(quán)限運(yùn)行的。
例如,在 Mac OS X 中,wall 工具(“write all的縮寫,因其會將某個消息寫入所有物理或虛擬終端設(shè)備而得名)的 setgid 被設(shè)為tty(如上所示)。當(dāng)您登錄并分配到一個用來鍵入的終端設(shè)備(該終端成為 Shell 的標(biāo)準(zhǔn)輸入)時,您將被指定為該設(shè)備的所有者,而 tty 成為組所有者。因?yàn)?wall 是以組 tty 的權(quán)限運(yùn)行的,所以它可以打開和寫入所有終端。
獲取列表
就像所有其他系統(tǒng)資源一樣,您的 Unix 有一個有限但十分龐大的進(jìn)程池(實(shí)際上,系統(tǒng)中的進(jìn)程幾乎用之不盡)。每個新任務(wù)(如啟動 vi 或運(yùn)行 xclock)都會立即從池中分配到一個進(jìn)程。在 UNIX 系統(tǒng)中,您可以使用 ps 命令,查看一個或多個進(jìn)程。
例如,如果您想查看您擁有的所有進(jìn)程,鍵入 ps -w --user username :$ ps -w --user mstreicher
您可以使用 ps -a -w -x 查看完整的進(jìn)程列表。(ps 命令的格式和特定的標(biāo)志隨各個 UNIX 版本而有所差異。請參閱系統(tǒng)的聯(lián)機(jī)文檔,以查找具體的說明。) -a 是選擇 tty 設(shè)備上運(yùn)行的所有進(jìn)程;-x 則可進(jìn)一步選擇與 tty 無關(guān)的所有進(jìn)程,通常包括所有的永久系統(tǒng)服務(wù),如 Apache HTTP server、cron 工作調(diào)度程序等等;-w 則以加寬的格式顯示內(nèi)容,在查看命令行或與每個進(jìn)程相關(guān)的應(yīng)用程序完整路徑名時很有用。
ps 具有豐富的功能,某些版本的 ps 甚至允許您自定義輸出。例如,下面就是一個有用的自定義進(jìn)程列表:
$ ps --user mstreicher -o pid,uname,command,state,stime,time PID USER COMMAND S STIME TIME14138 mstreic sshd: mstreicher S 09:57 00:00:0014139 mstreic -bashS 09:57 00:00:0014937 mstreic ps --user mstrei R 10:23 00:00:00
-o 根據(jù)各列名稱的順序?qū)敵鲞M(jìn)行格式化。pid、uname 和 command 分別指進(jìn)程 ID、用戶名和命令。state 代表進(jìn)程的狀態(tài),如正在睡眠 (S) 或運(yùn)行 (R)。(稍后將對進(jìn)程狀態(tài)進(jìn)行更詳細(xì)的說明。)stime 顯示命令的開始時間,time 則顯示該進(jìn)程占用了多少 CPU 時間。
進(jìn)程從哪里來?
在 Unix 中,某些進(jìn)程會從系統(tǒng)啟動到關(guān)機(jī)的時間里一直運(yùn)行,但大多數(shù)進(jìn)程都會隨任務(wù)的開始和完成而迅速地出現(xiàn)和消失。有時,某個進(jìn)程可能會“早夭“,甚至?xí)?ldquo;暴死(比如在系統(tǒng)崩潰時)。新的進(jìn)程是從哪里來的呢?
每個新的 UNIX 進(jìn)程都是某個現(xiàn)有進(jìn)程的產(chǎn)物。另外,每個新進(jìn)程(不妨將其稱為“子進(jìn)程)是對“父進(jìn)程的克隆體(至少有一瞬間是如此),直到“子進(jìn)程繼續(xù)獨(dú)立執(zhí)行為止。(如果每個進(jìn)程都是某個現(xiàn)有進(jìn)程的后代,那么不免會有一個疑問:“第一個進(jìn)程是從哪里來的?請參閱下面的側(cè)欄以尋找答案。)
雞和蛋
某些爭論是經(jīng)久不息的:生存還是毀滅?可口可樂還是百事可樂?PC 還是 Mac?當(dāng)然,還有一個古老的悖論,“雞生蛋,還是蛋生雞?
如果每個新的 UNIX 進(jìn)程都是某個現(xiàn)有的、正在運(yùn)行的進(jìn)程的后代,那么第一個進(jìn)程是從哪里來的?答案是:UNIX 內(nèi)核在系統(tǒng)啟動序列中產(chǎn)生了第一個進(jìn)程。
第一個進(jìn)程被恰如其分地稱為 init,所有其他系統(tǒng)進(jìn)程的親緣關(guān)系最終都可以追溯到 init。實(shí)際上,init 的進(jìn)程編號是 1。如果您要查看 init 的狀態(tài),可鍵入 ps -l 1:
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD4 S 0 10 0 68 0 - 373 select ? 0:02 init [2]正如您所看到的,init 的所有者 (UID) 是 0 (root)。和系統(tǒng)中所有其他進(jìn)程不同的是,init 沒有父進(jìn)程,它的父進(jìn)程 ID (PPID) 為 0。
圖 1-4 詳細(xì)說明了進(jìn)程的產(chǎn)生過程:
在圖 2 和圖 3 中,進(jìn)程 A (Process A),正在運(yùn)行一個由藍(lán)色方框表示的程序。它運(yùn)行編號為 10,11,12…的指令。進(jìn)程 A 有屬于自己的數(shù)據(jù)、程序的副本、打開的文件集,以及自己的環(huán)境變量集,當(dāng)進(jìn)程 A 剛出現(xiàn)時,會對它們進(jìn)行初次捕捉。
圖 2. 進(jìn)程 A 運(yùn)行代碼
在 Unix 中,fork() 系統(tǒng)調(diào)用(之所以有這個名稱,是因?yàn)樗且粋€調(diào)用或請求,要求操作系統(tǒng)進(jìn)行協(xié)助)被用來產(chǎn)生新的進(jìn)程。當(dāng)程序 A (Program A) 執(zhí)行指令 13 (Instruction 13) fork() 時,系統(tǒng)會立即創(chuàng)建進(jìn)程 A 的一個精確克隆版本,并將其命名為進(jìn)程 Z (Process Z)。Z 具有和 A 相同的環(huán)境變量、相同的內(nèi)存內(nèi)容、相同的程序狀態(tài),打開的文件也一樣。圖 3 顯示的是進(jìn)程 A 生成進(jìn)程 Z后,進(jìn)程 A 和 Z 的狀態(tài)。
圖 3. 進(jìn)程 A 生成自身的克隆體
起初,進(jìn)程 Z 是從進(jìn)程 A 停止的地方開始執(zhí)行的。也就是說,此后進(jìn)程 Z 從指令 14 (Instruction 14) 處開始執(zhí)行。進(jìn)程 A 會在同一指令位置繼續(xù)執(zhí)行。
一般來說,指令 14 處的編程邏輯將測試當(dāng)前的進(jìn)程是子進(jìn)程還是父進(jìn)程,也就是說,進(jìn)程 Z 和進(jìn)程 A 中的指令 14 分別判定這兩個進(jìn)程是否為其他進(jìn)程的后代或祖先。為了以示區(qū)別,fork() 系統(tǒng)調(diào)用在子進(jìn)程中返回 0,但返回給父進(jìn)程的卻是進(jìn)程 Z 的進(jìn)程 ID。
在上次測試之后,進(jìn)程 A 和進(jìn)程 Z 會出現(xiàn)差異,每個進(jìn)程會采用單獨(dú)的代碼路徑,就像路上出現(xiàn)岔道,每一個都會走上不同的分枝。生成一個新進(jìn)程的流程更多地被稱為分叉,這就像兩位旅行者走到了路上的岔道。因此,系統(tǒng)調(diào)用被命名為 fork()。
在分叉之后,進(jìn)程 A 可能會繼續(xù)運(yùn)行同一個應(yīng)用程序。而進(jìn)程 Z 則可能立即發(fā)生變化,轉(zhuǎn)到另一個應(yīng)用程序。后一種操作會改變程序通過進(jìn)程運(yùn)行的內(nèi)容,它被稱為執(zhí)行,但您可以把它看成是一次再生過程:雖然進(jìn)程 ID 不變,但進(jìn)程內(nèi)部的指令會被新程序的指令完全取代。圖 4 顯示的是稍后進(jìn)程 Z 的狀態(tài)。
圖 4. 進(jìn)程 Z 現(xiàn)在獨(dú)立于它的祖先,即進(jìn)程 A
分叉
您可以在自己的命令行,很方便地體驗(yàn)分叉操作。首先,打開一個新的 xterm。(您現(xiàn)在可能會認(rèn)識到,xterm 就是它本身的進(jìn)程,在 xterm 中,shell 是由 xterm 產(chǎn)生的一個獨(dú)立進(jìn)程)。接下來,輸入:ps -o pid,ppid,uname,command,state,stime,time
您應(yīng)該會看到類似這樣的內(nèi)容: PID PPID USER COMMAND S STIME TIME16351 16350 mstreic -bashS 11:23 00:00:0016364 16351 mstreic ps -o pid,ppid,u R 11:24 00:00:00
從該列表的 PPID 字段中,我們知道 ps 命令是 bash shell 的子進(jìn)程。(-bash 中的連字符說明 shell 實(shí)例是一個登錄 shell。)為了運(yùn)行 ps,bash 會分叉,創(chuàng)建一個新進(jìn)程;新進(jìn)程通過使用執(zhí)行,使其本身得以重生,轉(zhuǎn)化為 ps 的一個新的實(shí)例。
這里是另一個可供嘗試的實(shí)驗(yàn)。鍵入:sleep 10 & sleep 10 & sleep 10 & ps -o pid,ppid,uname,command,state,stime,time
您應(yīng)該會看到類似這樣的內(nèi)容:$ sleep 10 & sleep 10 & sleep 10 & ps -o pid,ppid,uname,command,state,stime,time PID PPID USER COMMAND S STIME TIME16351 16350 mstreic -bashS 11:23 00:00:0016843 16351 mstreic sleep 10 S 11:42 00:00:0016844 16351 mstreic sleep 10 S 11:42 00:00:0016845 16351 mstreic sleep 10 S 11:42 00:00:0016846 16351 mstreic ps -o pid,ppid,u R 11:42 00:00:00
命令行生成四個新進(jìn)程。在每個 sleep 命令后鍵入 &,在后臺運(yùn)行每一個命令,或與 Shell 并行。 ps 是生成的另一個進(jìn)程,但它是在前臺運(yùn)行的,可以防止 shell 在該進(jìn)程終止之前運(yùn)行其他命令。而且,如 PPID 的值所示,所有四個進(jìn)程都是 Shell 的后代。三個 sleep 命令都被標(biāo)為 S,因?yàn)闆]有哪個進(jìn)程會在它們睡眠時使用資源。
為了方便起見,shell 會持續(xù)跟蹤它生成的所有后臺進(jìn)程。鍵入 jobs,可以看到一個列表:
$ sleep 10 & sleep 10 & sleep 10 &[1] 16843[2] 16844[3] 16845$ jobs[1] Running sleep 10 &[2] Running sleep 10 &[3] Running sleep 10 &
此處,為了方便起見,三個工作分別用標(biāo)簽標(biāo)為 1,2 和 3。數(shù)字 16843、16844 和 16845 分別是每個進(jìn)程的進(jìn)程 ID。因此,后臺任務(wù) 1 即為進(jìn)程 ID 16843。
您可以利用這些標(biāo)簽,從命令行操作您的后臺工作。例如,如要終止某個命令,鍵入 kill %N ,其中 N 是該命令的標(biāo)簽。如要將某個命令由后臺移到前臺,請鍵入 fg %N :
$ sleep 10 & sleep 10 & sleep 10 &[7] 17741[8] 17742[9] 17743$ kill %7$ jobs[7] Terminated sleep 10[8]- Running sleep 10 &[9]+ Running sleep 10 &$ fg %8sleep 10
從命令行中同時異步運(yùn)行多個命令,是處理您自己的任務(wù)集的好方法。一個長時間運(yùn)行的工作(例如,系統(tǒng)管理的數(shù)值計(jì)算或大型程序的編譯)最適合放在后臺。為了捕獲每個后臺命令的輸出,請考慮使用重定向操作符 >、>&、>> 和 >>&,將輸入重定向到某個文件。當(dāng)后臺命令結(jié)束后,shell 會在下一個提示符之前顯示一條警告消息:
$ whoamimstreicher[8]- Donesleep 10[9]+ Donesleep 10$
向遙遠(yuǎn)的進(jìn)程池前進(jìn)
某些進(jìn)程會一直存活(如 init),而某些進(jìn)程會以新的形式重生(如您的 shell)。最終大多進(jìn)程都會因自然原因(即程序運(yùn)行結(jié)束)而消亡。
此外,您還可以將某個進(jìn)程放在一個掛起的動作序列中,等待被再次激活。正如先前的示例所示,您可以用 kill 提前終止某個進(jìn)程。
當(dāng)某個命令在前臺運(yùn)行時,如果您希望將它掛起,請按 Ctrl + Z:
$ sleep 10(Press Control-Z)[1]+ Stopped sleep 10$ ps PID PPID USER COMMAND S STIME TIME18195 16351 mstreic sleep 10 T 12:44 00:00:00
Shell 已將命令掛起,為了方便起見,還為它分配了一個標(biāo)簽。您可以像先前那樣使用這個標(biāo)簽,以終止工作或讓工作返回前臺。您還可以使用 bg 命令在后臺恢復(fù)這個進(jìn)程:
bg %1[1]+ sleep 10 &
當(dāng)某個命令在前臺運(yùn)行時,如果您想終止它,請按 Ctrl + C:
$ sleep 10(Press Control-C$ jobs$
您的 Shell 能使進(jìn)程的掛起和終止變得更容易,但在 Shell 單純的外表下,卻隱藏著復(fù)雜的一面。在內(nèi)部,Shell 使用 Unix 信號來影響進(jìn)程的狀態(tài)。信號是一個事件,它被用來向某個進(jìn)程發(fā)出警報。操作系統(tǒng)生成許多信號,但您可以將信號從一個進(jìn)程發(fā)送到另一個進(jìn)程,甚至能讓某個進(jìn)程給自己發(fā)送信號。
UNIX 包括多種信號,它們大多都有特殊目的。例如,如果您將信號 SIGSTOP 發(fā)送到某個進(jìn)程,該進(jìn)程將掛起。(要獲取信號的完整列表,請鍵入 man 7 signal 或鍵入 kill -L)。您可以用 kill 命令發(fā)送信號。
$ sleep 20 &[1] 19988$ kill -SIGSTOP 19988$ jobs[1]+ Stopped sleep 20
起初,sleep 命令在后臺啟動,其進(jìn)程 ID 為 19988。在發(fā)送 SIGSTOP 之后,該進(jìn)程會改變狀態(tài),變?yōu)閽炱鸹蛲V埂0l(fā)送另一個信號 SIGCONT,重新激活進(jìn)程,該進(jìn)程將從上次停止的地方繼續(xù)執(zhí)行。
也就是說,每次您按 Ctrl + Z 時,您的 shell 將向前臺發(fā)送 SIGSTOP 信號。bg 命令發(fā)送 SIGCONT。而 Ctrl + C 則會發(fā)送 SIGTERM,要求立即終止進(jìn)程。
一些信號可以被某個進(jìn)程阻塞,應(yīng)用程序可以通過設(shè)計(jì),顯式地“捕捉 (catch)信號,并以一種特殊的方式對每個事件作出反應(yīng)。例如,系統(tǒng)服務(wù) xinetd 會按需要啟動其他網(wǎng)絡(luò)服務(wù),它在收到 SIGHUP 時會重新讀取它的配置文件。在 Linux 中,向 init 發(fā)送信號,可能會改變系統(tǒng)的運(yùn)行級別,甚至?xí)?dǎo)致系統(tǒng)關(guān)閉。.(這里有一個問題:kill %1 和 kill 1 有什么區(qū)別?
進(jìn)程甚至可以給自己發(fā)送信號。想像一下,您正在編寫一個游戲,想留給用戶五秒鐘時間作出反應(yīng)。您的代碼可以設(shè)置一個五秒鐘的定時器,接下來繼續(xù)進(jìn)行重繪屏幕等操作。當(dāng)定時器的時間耗盡后,將有一個 SIGALRM 信號被送回您的進(jìn)程。呯!時間到!
(這里提供了問題的答案:kill %1 會終止標(biāo)簽為 1 的后臺工作。kill 1 會終止 init,當(dāng)必須關(guān)閉計(jì)算機(jī)時,將向操作系統(tǒng)發(fā)送這個信號。)
在特殊情況下,操作系統(tǒng)還可以將一些其他信號傳送給進(jìn)程。內(nèi)存違例會引發(fā) SIGSEGV 信號,立即終止進(jìn)程,并留下一個內(nèi)核轉(zhuǎn)儲。有一個特殊的信號 SIGKILL 是無法被阻塞或捕捉的,它會立即終止某個進(jìn)程。
和 Unix 中許多其他資源一樣,您只能向您擁有的進(jìn)程發(fā)送信號。這可以防止您終止重要的系統(tǒng)服務(wù)和其他用戶的進(jìn)程。超級用戶 root 可以向任何進(jìn)程發(fā)送信號。
更多魔法揭密
UNIX 有許多可活動的部分。它有系統(tǒng)服務(wù)、設(shè)備、內(nèi)存管理器等等。好在這些復(fù)雜的花樣大都被隱藏起來,不會被看到,或可以通過用戶界面(如 shell 或窗口工具)很方便地使用。更妙的是,如果您想深入探究,隨時都可以使用 top, ps 和 kill 等專用工具。
現(xiàn)在您已經(jīng)知道了進(jìn)程的工作原理,可以組成自己的單人樂隊(duì)了。只有一個要求:成為一只自由自在的飛鳥!
相關(guān)文章:
1. 對話 UNIX:第 2 部分: 做得多不如做得巧2. 對話 UNIX,第 11 部分: 漫談 UNIX 文件系統(tǒng)3. 對話 UNIX,第 7 部分: 命令行慣用語4. 對話 UNIX: !$#@*%5. 對話 UNIX: 關(guān)于 inode6. 對話 UNIX,第 3 部分: 在命令行中完成所有的工作7. 對話 UNIX: 掌握強(qiáng)大的命令行8. 對話 UNIX: Squirrel--可移植的 shell 和腳本語言9. 對話 UNIX,第 13 部分: 另外十種命令行組合10. 對話 UNIX,第 6 部分: 通過腳本實(shí)現(xiàn)操作的自動化
