TLPI一書在說明fork()、stdio buffers以及exit()之間的關係時,舉了一個有趣的例子,大家先看看下面的程式碼與執行結果:
執行看看:
[mars@dream sys_call]$ ./fork_puzzle
Hello
world
看起來沒有什麼奇怪,但如果是下面這樣的執行結果,你還覺得理所當然嗎? :-)
[mars@dream sys_call]$ ./fork_puzzle > log
[mars@dream sys_call]$ cat log
world
Hello
Hello
乍看之下,奇怪的事情發生了:world比Hello先印出來,而且Hello還印了兩遍。然而,熟悉C stdlib的實作方式與UNIX的fork()語意後,就很容易解釋這個現象了,思路如下:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(void)
{
printf("Hello\n");
write(STDOUT_FILENO, "world\n", 6);
if (fork() == -1) {
write(STDERR_FILENO, "fork err\n", 9);
exit(EXIT_FAILURE);
}
exit(EXIT_SUCCESS);
}
|
執行看看:
[mars@dream sys_call]$ ./fork_puzzle
Hello
world
看起來沒有什麼奇怪,但如果是下面這樣的執行結果,你還覺得理所當然嗎? :-)
[mars@dream sys_call]$ ./fork_puzzle > log
[mars@dream sys_call]$ cat log
world
Hello
Hello
- 因為write()只是system call的C wrapper,所以呼叫時會立即執行,預設I/O模型會在執行完畢後才返回。
- printf()為了避免頻繁呼叫write(),會有一塊user space的buffer來存放多道printf()裡的字串內容,在輸出為標準輸出時,預設採用line-buffered,在輸出為檔案時,則為block-buffered。
- 當fork()執行後,child會有parent幾乎相等同的一份memory image copy,因此複製了printf()的unflushed string buffer。
- 於是,當導出到檔案時,printf()在block buffer尚未滿前不會輸出,因此造成write()先輸出,然後執行fork()後child也會有一份"Hello\n",並在exit()時被強制輸出。
解決方式有好幾種,可以在每次printf()後都用fflush(),或儘量不要混用printf()與write()。
我們可以看到,這個例子反應的其實就是現實軟體開發的縮影,為了效能,printf()引進了新機制,卻也在某種情況下引起新問題。有趣的是,只要我們能讓好處多於壞處,那麼引進的改善就是有效的,但也必須時時刻刻記住可能的抽象洩漏會在何時回踢我們一腳。 :-)
類似的概念也可用來解釋下面的小謎題,有興趣的朋友可以確認一下自己對UNIX programming的理解是否足夠~ :-)
回覆刪除[mars@dream sys_call]$ cat exec_puzzle.c
#include <stdio.h>
#include <unistd.h>
int main(void)
{
printf("Hello\n");
execlp("sleep", "sleep", "0", NULL);
}
[mars@dream sys_call]$ ./exec_puzzle
Hello
[mars@dream sys_call]$ ./exec_puzzle > log
[mars@dream sys_call]$ cat log